jupyter-notebook - 孟加拉语文本词云

Question

我想取出孟加拉语文本的词云，但是在打印的时候，每个单词的辅音都是分开打印的。

data = pd.read_csv('/content/gdrive/MyDrive/data.csv',encoding='UTF-8')
refined_sentence = " ".join(data)
regex = r"[\u0980-\u09FF]+"
wc = WordCloud(width=800, height=400, mode="RGBA",background_color=None, colormap="hsv", 
stopwords = stopwords, font_path="kalpurush.ttf", regexp=regex).generate(refined_sentence)
plt.figure(figsize=(7, 7))
plt.imshow(wc, interpolation='none')
plt.axis("off")
plt.show()

score 0 · Accepted Answer

我遵循了这个评论，最终可以解决 Ubuntu 中的问题。

第 1 步：!sudo apt-get install libfreetype6-dev libharfbuzz-dev libfribidi-dev gtk-doc-tools

第 2 步：!wget -O raqm-0.7.0.tar.gz https://raw.githubusercontent.com/python-pillow/pillow-depends/master/raqm-0.7.0.tar.gz

现在 raqm-0.7.0.tar.gz 文件应该在您的下载部分。

第 3 步：!tar -xzvf raqm-0.7.0.tar.gz

第 4 步：!cd raqm-0.7.0

第 5 步：!./configure --prefix=/usr && make -j4 && sudo make -j4 install

第 6 步：现在您只需重新安装 Pillow 库。激活正确的环境。然后运行以下命令：

python3 -m pip install --upgrade pip python3 -m pip install --upgrade Pillow

而已！现在你有了一个可以在图像中生成适当的孟加拉语和其他印度语字体的 Pillow 库。

jupyter-notebook - 孟加拉语文本词云

1 回答 1

Related

Reference