8

我想实现以下(全文搜索),

SELECT * FROM tablename where columnname REGEXP '[[:<:]]some string[[:>:]]'

我只对全文列中的确切字符串(而不仅仅是单词)感兴趣。

我一直在 MySQL 中使用上面的确切 SQL,现在将大部分代码迁移到 android 应用程序。

但我一直在查看各种帖子,其中提到 Android Sqlite 不支持 REGEXP(例如:link1link2link3)。

有没有办法在 Android 中启用 REGEXP?

如果没有,上述 SQL 是否有任何替代方案?

谢谢,

编辑: 目前我在 Android 中使用 REGEXP 时收到以下异常,

android.database.sqlite.SQLiteException: no such function: REGEXP (code 1):...

我知道我们可以使用 GLOB 和 LIKE (甚至可能是 MATCH )。如何columnname REGEXP '[[:<:]]somestring[[:>:]]'转换为使用GLOB和/或LIKE和/或MATCH

解决方案 1:在@cybersam的帮助下,我正在使用以下内容(经过一些修改)

SELECT * FROM tablename where
  (columnname GLOB '*some string*' OR columnname GLOB '*Some string*') AND 
(
(
    (columnname GLOB '*[^a-zA-Z0-9_]some string[^a-zA-Z0-9_]*' AND
    columnname GLOB '*some string[^a-zA-Z0-9_]*' AND
    columnname GLOB '*[^a-zA-Z0-9_]some string*')
OR
    (columnname GLOB '*[^a-zA-Z0-9_]Some string[^a-zA-Z0-9_]*' AND
    columnname GLOB '*Some string[^a-zA-Z0-9_]*' AND
    columnname GLOB '*[^a-zA-Z0-9_]Some string*')
)
)

GLOB是区分大小写的,所以我有一个额外的OR

@cybersam的第二种解决方案在我的情况下要快得多。

解决方案2:处理不区分大小写

SELECT * FROM tablename where
  (columnname GLOB '*[sS][oO][mM][eE] [sS][tT][rR][iI][nN][gG]*') AND 
(
    (
    columnname GLOB '*[^a-zA-Z0-9_][sS][oO][mM][eE] [sS][tT][rR][iI][nN][gG][^a-zA-Z0-9_]*' AND 
    columnname GLOB '*[sS][oO][mM][eE] [sS][tT][rR][iI][nN][gG][^a-zA-Z0-9_]*' AND 
    columnname GLOB '*[^a-zA-Z0-9_][sS][oO][mM][eE] [sS][tT][rR][iI][nN][gG]*')
)
4

1 回答 1

9

要真正支持REGEXP,您必须添加自己的regexp() 用户函数

这个链接可能会帮助您弄清楚如何为 Android 创建用户定义的函数——但这并不简单。

如果您的模式非常简单,那么GLOB 运算符可能就足够了。

例如,要执行与此 MYSQL 查询等效的搜索:

SELECT * FROM tablename where columnname REGEXP '[[:<:]]some string[[:>:]]'

你可以在 SQLite 中试试这个:

SELECT * FROM tablename where
  columnname GLOB '[^a-zA-Z0-9_]some string[^a-zA-Z0-9_]' OR
  columnname GLOB 'some string[^a-zA-Z0-9_]' OR
  columnname GLOB '[^a-zA-Z0-9_]some string' OR
  columnname GLOB 'some string';

上述查询使用的事实是,在 MYSQL 中,单词字符被定义为字母数字字符或下划线。还需要附加OR术语来匹配 . 的任何一侧(或两侧)都没有文本的情况some string

最后,如果 'some string' 在 中相对少见columnname,那么下面更长的查询实际上可能更快,因为它只会对GLOB少数值进行多次评估:

SELECT * FROM tablename where
  columnname GLOB '*some string*' AND (
    columnname GLOB '[^a-zA-Z0-9_]some string[^a-zA-Z0-9_]' OR
    columnname GLOB 'some string[^a-zA-Z0-9_]' OR
    columnname GLOB '[^a-zA-Z0-9_]some string' OR
    columnname GLOB 'some string');
于 2015-01-30T03:22:14.467 回答