3

好的,我对此有点迷失,我目前正在尝试使用第二个 ManagedObjectContext 运行后台核心数据操作,其类型设置为 NSPrivateQueueConcurrencyType 并因上述错误而惨遭失败。

我有一个 NSOperation 的自定义子类,它被传递一个字符串的 NSArray 和来自主线程的 PersistentStoreCoordinator,然后它创建自己的 ManagedObjectContext,运行查询并执行和操作。

这是该课程的代码:

//
//  ProcessProfanity.m
//  Hashtag Live Desktop
//
//  Created by Gareth Jeanne on 24/03/2014.
//  Copyright (c) 2014 Gareth Jeanne. All rights reserved.
//

#import "ProcessProfanity.h"
#import "Tweet.h"

static const int ImportBatchSize = 250;

@interface ProcessProfanity ()
@property (nonatomic, copy) NSArray* badWords;
@property (nonatomic, strong) NSManagedObjectContext* backgroundContext;
@property (nonatomic, strong) NSPersistentStoreCoordinator* persistentStoreCoordinator;
@end

@implementation ProcessProfanity


{

}


- (id)initWithStore:(NSPersistentStoreCoordinator*)store badWords:(NSArray*)words
{
self = [super init];
if(self) {
    self.persistentStoreCoordinator = store;
    self.badWords = words;
}
return self;
}


- (void)main
{
_backgroundContext = [[NSManagedObjectContext alloc] initWithConcurrencyType:NSPrivateQueueConcurrencyType];
_backgroundContext.persistentStoreCoordinator = [self persistentStoreCoordinator];
_backgroundContext.undoManager = nil;
[_backgroundContext performBlockAndWait:^
{
    [self import];
}];
}

- (void)import
{

//Create new fetch request
NSFetchRequest *request = [[NSFetchRequest alloc] init];

//Setup the Request
[request setEntity:[NSEntityDescription entityForName:@"Tweet" inManagedObjectContext:self.backgroundContext]];

NSError *error = nil;

//Create an array from the returned objects
NSArray* tweetsToProcess = [self.backgroundContext executeFetchRequest:request error:&error];
NSAssert2(tweetsToProcess != nil && error == nil, @"Error fetching events: %@\n%@", [error localizedDescription], [error userInfo]);

for (Tweet* tweetToCheck in tweetsToProcess){
    __block NSString *result = nil;
    [self.badWords indexOfObjectWithOptions:NSEnumerationConcurrent
                                   passingTest:^(NSString *obj, NSUInteger idx, BOOL *stop)
     {
         if (tweetToCheck){
             if ([tweetToCheck.text rangeOfString:obj].location != NSNotFound)
             {
                 result = obj;
                 *stop = YES;
                 //return YES;
             }
         }
         return NO;
     }];

    if (!result){
        //DDLogVerbose(@"The post does not contain any of the words from the naughty list");
        if(tweetToCheck){
            tweetToCheck.profanity = [NSNumber numberWithBool:false];
        }
    }
    else{
        if(tweetToCheck){
            //DDLogVerbose(@"The string contains '%@' from the the naughty list", result);
            tweetToCheck.profanity = [NSNumber numberWithBool:true];
        }
    }

}
[self.backgroundContext save:NULL];
}

@结尾

这就是我所说的:

-(void)checkForProfanity{

if(!self.operationQueue){
self.operationQueue = [[NSOperationQueue alloc] init];
}

NSArray* termsToPass = [self.filterTerms copy];
ProcessProfanity* operation = [[ProcessProfanity alloc] initWithStore:self.persistentStoreCoordinator badWords:termsToPass];
[self.operationQueue addOperation:operation];


}

编辑 1

我似乎遇到错误的特定行,或者至少 Xcode 中断的地方是:

if ([tweetToCheck.text rangeOfString:obj].location != NSNotFound)

我设法缩小了一点,包含要搜索字符串的术语列表的 NSArray 可能非常大,可能超过 1,000 个 NSString。如果我用那个大小的数组进行测试,我就会遇到问题。但是,如果我将数组减少到大约 15 个 NSString,我不会收到错误,所以我认为这不一定是线程相关的问题,我想知道数组是否在主线程中被释放。我已修改代码以进行深层复制,然后按如下方式进行 __block 复制,但似乎没有帮助。

self.badWords = [[NSArray alloc] initWithArray:words copyItems:YES];

for (Tweet* tweetToCheck in tweetsToProcess){
    __block NSArray *array = [[NSArray alloc] initWithArray:self.badWords copyItems:YES];
    __block NSString *result = nil;
    [array indexOfObjectWithOptions:NSEnumerationConcurrent

事实上,在 Xcode 中断的地方,如果我 PO 数组,我得到一个找不到对象的消息,但如果我 PO 结果,我正确地得到一个返回的对象,它是 nil。

编辑 2

所以我做了以下改变,没有改变:

使 NSArray 强大而不是复制:

@property (nonatomic, strong) NSArray* badWords;

并在分配时将其复制:

self.badWords = [[NSArray alloc] initWithArray:words copyItems:YES];

并在处理对象的实际方法中使用 ___block 声明创建了 NSArray 的本地副本:

__block NSArray *array = [[NSArray alloc] initWithArray:self.badWords copyItems:YES];

这肯定意味着它会在 ProcessProfanity 对象的生命周期内一直存在?

我期望能够从块内的断点 PO 数组是错误的吗?

4

2 回答 2

4

在这种情况下,错误消息“error: NULL _cd_rawData but the object is not being turn into a fault”表示您正在访问其上下文之外的托管对象。基本上,您的 fetch 会将持久存储中的所有推文作为故障返回。一旦您尝试访问托管对象上的属性,Core Data 将触发错误并从存储中获取完整的对象。

indexOfObjectWithOptions:passingTest:通过使用您的选项调用 NSArray 方法NSEnumerationConcurrent意味着您要对数组中的元素执行异步执行。关键字concurrent表示可以使用多个线程对数组元素进行操作。

在您的上下文中,这意味着访问此块内的托管对象可能会导致在与拥有该对象的托管对象上下文不同的线程上访问它。因此,当您在条件检查中访问 tweetToCheck.text -if ([tweetToCheck.text rangeOfString:obj].location != NSNotFound)时,核心数据从持久存储中获取该托管对象并将其返回到不属于托管对象上下文线程的线程。

此外,没有必要使用该方法indexOfObjectWithOptions:passingTest:,因为您实际上对此操作的结果并不感兴趣。

在我看来,使用 NSSet 可能更方便,因为您只是在测试给定的推文词是否存在于您的亵渎词中。引用 NSSet 的文档:“当元素的顺序不重要并且测试对象是否包含在集合中的性能是一个考虑因素时,您可以使用集合作为数组的替代品”。显然,这似乎符合您的标准。

所以你的初始化看起来像:

 -(id)initWithStore:(NSPersistentStoreCoordinator*)store 
           badWords:(NSSet*)badWords
{
   self = [super init];
   if(self) {
     self.persistentStoreCoordinator = store;
     self.badWords = [words copy];
   }
   return self;
}

由于您只对更新尚未标记为亵渎的推文感兴趣,因此您可能只想获取尚未标记为亵渎的推文:

//Create new fetch request
NSFetchRequest *request = [[NSFetchRequest alloc] init];

//Setup the Request
[request setEntity:[NSEntityDescription entityForName:@"Tweet" inManagedObjectContext:self.backgroundContext]];
[request setPredicate:[NSPredicate predicateWithFormat:@"profanity = NO"]];

既然你有一系列不亵渎的推文,你可以遍历你的推文并检查每个单词是否包含亵渎的词。您唯一需要处理的是如何将您的推文分成单词(忽略逗号和感叹号等)。然后,对于每个单词,您都需要去掉它的变音符号,并可能忽略大小写。所以你最终会遇到这样的人:

if([self.badWords containsObject:badWordString]) {
    currentTweet.profanity = [NSNumber numberWithBOOL:YES];
}

请记住,您可以在 NSSet 上运行谓词,以便实际执行不区分大小写和变音符号的查询:

NSPredicate *searchPredicate = [NSPredicate predicateWithFormat:@"SELF = %@[cd]",wordToCheck];
BOOL foundABadWord = ([[[self.badWords filteredSetUsingPredicate:searchPredicate] allObjects] count] > 0);

您可能要考虑的另一件事是删除推文中的重复单词,您真的不想多次执行相同的检查。因此,根据您如何找到性能,您可以将推文的每个单词放入 NSSet 中,然后简单地对推文中的唯一单词运行查询:

if([[self.badWords intersectsSet:tweetDividedIntoWordsSet]) {
    //we have a profane tweet here!
}

您选择哪种实现取决于您,但假设您在应用程序中仅使用英语,您肯定会想要运行大小写和变音符号不敏感搜索。

编辑

最后要注意的一件事是,无论您如何尝试,人们始终是检测亵渎或辱骂性语言的最佳手段。我鼓励您阅读此 SO 关于检测亵渎的帖子 -如何实施良好的亵渎过滤器?

于 2014-03-26T15:52:32.617 回答
1

好的,所以仍然不太确定发生了什么,但我遵循 Daniels 的建议并重新编写了 indexOfObjectWithOptions 方法,现在它正在工作。为了完整起见,希望能对其他人有所帮助,这就是我最终要做的。

    DDLogInfo(@"Processing posts to check for bad language");
for (Tweet* tweetToCheck in tweetsToProcess){
    __block NSArray *array = [[NSArray alloc] initWithArray:self.badWords copyItems:YES];
    __block NSString *result = nil;

    NSRange tmprange;
    for(NSString *string in array) {
        tmprange = [tweetToCheck.text rangeOfString:[NSString stringWithFormat:@" %@ ", string]];
        if (tmprange.location != NSNotFound) {
            result = string;
            DDLogVerbose(@"Naughty Word Found: %@", string);
            break;
        }
    }

    if (!result){
        //DDLogVerbose(@"The post does not contain any of the words from the naughty list");
        if(tweetToCheck){
            tweetToCheck.profanity = [NSNumber numberWithBool:false];
        }
    }
    else{
        if(tweetToCheck){
            //DDLogVerbose(@"The string contains '%@' from the the naughty list", result);
            tweetToCheck.profanity = [NSNumber numberWithBool:true];
        }
    }
于 2014-03-25T16:32:40.003 回答