我使用 Apache Tika 来提取各种文件的文本。现在我还想用它来检测文件的正确 MIME 类型。
例如,这适用于...
- PDF 文件 (
application/pdf
) - HTML 文件 (
text/html
)
...但不适用于:
- CSS 文件(
text/plain
而不是text/css
) - Javascript 文件(
text/plain
而不是text/javascript
) - ...
(这些 Mime 类型的结果来自我的应用程序以及 tika-app)。
我的应用程序需要一个确切的 MIME 类型,text/css
而不是一般的text/plain
. 蒂卡有可能吗?