5

我正在尝试保存 iPhone 应用程序中的评论,该应用程序可能并且现在最有可能包含表情符号。无论我做什么,我都无法将表情符号保存到 MySQL 数据库中……不断出现 Unicode 错误。

  • Python 2.6.5
  • Django 1.2.1
  • MySQL 数据库(表和行设置为 utf8 字符集)
  • 将数据保存到 VARCHAR(255) 字段

我不断收到的错误是:

Incorrect string value: '\xF0\x9F\x97\xBC \xF0...' for column 'body' at row 1

我传入数据库的字符串是:

test_txt = u"Emoji - \U0001f5fc \U0001f60c \U0001f47b ...".encode('utf-8')

更新:这是我正在使用的模型:

class ItemComment(db.Model):
  item = db.ForeignKey(Item)
  user = db.ForeignKey(Profile)
  body = db.CharField(max_length=255, blank=True, null=True)

  active = db.BooleanField(default=True)
  date_added = db.DateTimeField(auto_now_add=True)

  def __unicode__(self):
    return "%s" % (self.item)

奇怪的是,如果我尝试将其传递给我在 MySQL 而不是 Django models.py 中创建的字段,它可以正常工作。但是,一旦我在 Django 模型中注册了该字段,它就会死掉。有没有另一种方法来存储这些可能?

任何想法都会很棒。
我不能更坚持这一点......

更新 2:使用以下 UPDATE 语句在终端中跟踪它(注意 U0001f5fc)

UPDATE 'table' SET 'body' = '', WHERE 'table'.'id' = 1 ; args=(u'\U0001f5fc')

尽可能使用核心来传递价值:

force_unicode(smart_str(value), encoding='utf-8', strings_only=False, errors='ignore')

但错误仍然抛出:

_mysql_exceptions.Warning: Incorrect string value: '\xF0\x9F\x97\xBC' for column 'body' at row 1

彻底输了!!!

干杯,

4

2 回答 2

5

更改 MySQL 服务器的字符集 utf8mb4(5.5.3 以后的版本)

my.ini( my.cnf)

[mysqld]
character_set_server = utf8mb4
collation-server = utf8mb4_unicode_ci

或 SQL 查询

SET NAMES 'utf8mb4';

另见http://dev.mysql.com/doc/refman/5.5/en/charset-connection.html

或删除角色来执行此操作。

Python

import re
# emoji_text is unicode
no_emoji_text = re.sub('[\xF0-\xF7][\x80-\xBF][\x80-\xBF][\x80-\xBF]', '', str(emoji_text))

谢谢你。

另见 MySQL throws Incorrect string value error

于 2012-09-04T05:10:33.383 回答
0

我使用 Django 1.11 及以下版本setting.py,创建sql可以很好地存储表情符号,

DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': 'db_name',
        'USER': 'db_user',
        'PASSWORD': 'your_password',
        'OPTIONS': {'charset': 'utf8mb4'},   # note here!!!
    }
}

sql来自这个答案

CREATE DATABASE db_name CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
于 2017-11-06T09:40:53.427 回答