我需要存储大量 Twitter 推文
- 哪个可能是推文的最佳数据库类型 → 最好的猜测是
TEXT
- 我也需要防止重复。
varchar(255)
→ 最好的猜测UNIQUE key
- 可能是
varchar(140)
字符应该起作用,但我们也有中文字符?(会节省很多空间)
- 可能是
另一个想法是,将所有推文存储为TEXT
并添加另一列,将推文哈希到 MD5 并UNIQUE key
在列上添加一个。
问题:存储推文的最佳 MySQL 类型是什么?
我需要存储大量 Twitter 推文
TEXT
varchar(255)
→ 最好的猜测UNIQUE key
varchar(140)
字符应该起作用,但我们也有中文字符?(会节省很多空间)另一个想法是,将所有推文存储为TEXT
并添加另一列,将推文哈希到 MD5 并UNIQUE key
在列上添加一个。
问题:存储推文的最佳 MySQL 类型是什么?
由于推文被定义为 140 个字符的字符串,因此您可以将其存储为nvarchar(140)
好像称“最好的”有点冒昧,因为我们不知道您的预期用途是什么......
http://en.wikipedia.org/wiki/Twitter
没有理由进行 MD5 哈希。如果这是您的实际意图,只需在列上设置唯一性约束。
一条推文最多 140 个字符,所以我肯定会使用它。
varchar(140)
是我会使用的。