问题标签 [doccano]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
django - Django STATIC_URL 请求
我有这个 Django 项目(https://github.com/chakki-works/doccano),我正在尝试使用Apache
+进行部署mod_wsgi
。
我将我的.conf
文件设置为作为守护进程工作,其中应用程序在别名 ( /doccano
) 路径下提供服务:
当我映射 /doccano 别名时没有提供静态文件时,应用程序运行良好:
固定的Alias /static/ /var/www/doccano/app/staticfiles/
静态文件问题。
但是我仍然想在这个服务器上服务其他应用程序,所以映射/static/
可能不是一个好主意。
所以我想知道这种情况下最好的方法是什么。我试图/doccano/
在静态请求 url 设置的开头添加,STATIC_URL=/doccano/static/
但我认为此属性不适用于进行此类设置。
python - 如何导出“带有来自 spaCy 的实体的文档”以在 doccano 中使用
我想用 doccano 或其他“开源文本注释工具”训练我的模型,并不断改进我的模型。
为此,我的理解是,我可以以此处描述的格式将带注释的数据导入到 doccano:
所以第一步我已经加载了一个模型并创建了一个文档:
我知道我可以从 doccano 导出 jsonl 格式(带有文本和带注释的标签)并用它训练模型,但我想知道如何从 python 中的 spaCy doc 导出该数据,以便我可以将其导入到 doccano。
提前致谢。
python - spaCy CLI 调试在由 spacy.gold.docs_to_json 转换的 CLI 格式 JSON 中显示 0 个训练/开发文档
问题
我正在尝试运行 spaCy CLI,但是当我运行调试时,我的训练数据和开发数据似乎不正确:
无论如何尝试训练会产生:
我的培训和开发文档是使用 spacy.gold.docs_to_json() 生成的,使用以下函数保存为 json 文件:
我在http://www.jsonlint.com验证了它们都是有效的 json 。
我使用该函数创建了这些 json 源自的文档:
我编写了上面的函数以在线训练所需的格式返回示例(例如,如https://github.com/explosion/spaCy/blob/master/examples/training/train_ner.py所示)以及形成这些“模拟”文档,以便我可以使用 displacy 和/或 CLI。对于后一个目的,我遵循https://github.com/explosion/spaCy/blob/master/spacy/cli/converters/jsonl2json.py中显示的代码有几个显着的差异。_cleanup_spans() 函数与示例中的函数相同。我没有使用 minibatch(),而是为我的每个标记注释制作了一个单独的文档。另外,(也许很重要?)我发现使用句子化器破坏了我的许多注释,可能是因为跨度以 _cleanup_spans() 函数无法正确修复的方式发生变化。删除语句器会导致 docs_to_json() 函数抛出错误。因此,在我的函数中(与链接示例不同),在将实体写入 每个文档后,我在每个文档上运行语句器,这样可以正确保留我的注释并允许 docs_to_json() 函数运行而不会产生任何抱怨。
在 import_from_doccano() 中调用的函数 load_jsonl 定义为:
我的注释每个长度约为 10000 个字符或更少。它们是从 doccano 导出的
( https://doccano.herokuapp.com/ ) 作为 JSONL 使用以下格式:
使用以下函数将数据分为训练集和测试集:
最后,每个都使用以下函数写入 json:
我不明白为什么调试显示 0 个培训文档和 0 个开发文档,或者为什么 train 命令失败。据我所知,JSON 看起来是正确的。我的数据格式不正确,还是发生了其他事情?任何帮助或见解将不胜感激。
这是我关于 SE 的第一个问题——如果我未能遵循某些或其他指导方针,请提前道歉。涉及到很多组件,所以我不确定如何生成一个最小的代码示例来复制我的问题。
环境
Mac OS 10.15 Catalina 一切都是 pip3 安装到用户路径 没有虚拟环境
azure - 尝试将 docanno 部署到 Azure
刚接触 Azure 并寻求一些支持。我想将 docanno https://github.com/chakki-works/doccano部署到我为 Microsoft Azure 提供的免费学校/工作订阅。
到目前为止,我完全不成功。在部署到 Azure 的 docanno 页面上,它声明它使用 Web App for Containers + PostgreSQL 数据库 - 这些是否与 Azure 的免费帐户一起提供?Web App for Containers 页面显示我的订阅不包括该内容。
我很感激这里的任何帮助,而且很明显我对此很陌生,所以如果这条信息不清楚,我深表歉意。
npm - 如何告诉 npm 从本地安装而不是 git
我有一台无法访问互联网但有本地 npm 的服务器。我正在尝试安装 Node.js 应用程序,其中一个模块指向 github。该包是依赖包之一的一部分。
大多数包都是从本地 npm 下载的,但有些指向 github,然后我得到错误:
我可以下载存储库并将其上传到服务器,但是如何安装 github 包?
python - 预训练的 spacy 模型或 spacy.blank,对于自定义 NER,哪个是正确的方法?
我想训练一个 spacy 自定义 NER 模型,这是最好的选择?
火车数据准备好了(doccano)
选项 1. 使用现有的预训练 spacy 模型并使用自定义 NER 更新它?
选项 2. 使用带有自定义 NER 的 spacy.blank() 创建一个空模型?
我只想在文本中识别我的自定义实体,不需要其他类型的实体......目前
python - 如何解决应用程序的 29 个未应用迁移:admin、api、auth、authtoken、contenttypes、sessions、social_django
我在我的桌面上设置了 Doccano 来执行序列标记任务。我按照网站上有关如何设置 Doccano 的说明进行操作。一切正常,直到我遇到迁移错误的最后一个代码。
这是在 git bash 上运行上面的最后一个代码后出现的错误
错误说运行'python manage.py migrate。当我在终端中运行代码时,我得到一个 [Errno 2] No such file or directory。请看下文。谢谢你的帮助。
node.js - 通过 Node.js 前端访问时禁止访问 Django 资源
我克隆了一个 Django+Node.js 开源项目,其目标是上传和注释文本文档,并将注释保存在Postgres db中。该项目具有docker-compose 的堆栈文件,适用于 Django 开发和生产设置。这两个堆栈文件都可以使用 Postgres 数据库开箱即用。
现在我想把这个项目上传到谷歌云——作为我的第一个容器化应用程序。作为第一步,我只想将持久存储移动到Cloud SQL,而不是堆栈文件中包含的 Postgres 映像。我的堆栈文件(Django dev)如下所示
我有一堆模型,例如Django 后端中的项目,我可以使用 Django 管理界面查看、修改、添加和删除它们,但是在尝试通过 Node.js 视图访问它们时,我得到一个403 Forbidden错误。这是我所有的 Django 模型的情况。
作为参考,在上面的堆栈文件中,我列出了与最初克隆的 Docker-compose 堆栈文件的唯一区别,其中DATABASE_URL
用于指向本地 Postgres Docker 映像,如下
为了检查我的 GCP 密钥是否正确,我尝试单独部署 Cloud SQL 代理容器并与之交互(添加、删除和更新包含表中的行),这是可能的。但是,我可以在已部署的 Docker-compose 堆栈中成功使用 Django 管理界面这一事实应该已经证明 Cloud SQL 代理一切正常。
无论如何,我都不是经验丰富的 Node.js 开发人员,并且对 Django 和 Django admin 有一点经验。我使用 Docker-compose 设置的目的是我不必为复杂的 js 视图而烦恼,而只需要处理 Python 业务逻辑。
python - 如何解决读取 webpack-stats.json 的错误?
我正在我的桌面上设置 Doccano 以使用以下代码创建本地克隆。
一切顺利,直到我去http://127.0.0.1:8080。然后我得到下面的错误。你能帮我解决这些问题吗?谢谢。
下面有图片可以详细查看错误读数:
python - Django在不同数据库中共享用户导致500和403错误
目标
我希望 Doccano 将保存在我的主应用程序 (app2) 中的用户用作自己的用户,而不是 Doccano 使用自己的用户。这些都是 Django 数据库,所以我认为这些不是 Doccano 特定的问题
问题
用户之间的连接工作,我可以用 app2 用户登录到 Doccano。当 /projects 页面500 internal server error
出现在网站上时,终端 app2 会打印:ERROR: relation "api_project" does not exist at character 363
当创建一个新项目403 Forbidden
时,会出现一个 POST 到/v1/projects
我做了什么
我目前正在它们的容器中运行 Doccano 后端、nginx 和 postgres,并同时运行 app2 和postgres_app2
in 容器。Doccano 后端与 Doccano postgres 共享一个(docker-compose)网络,另一个网络与postgres_app2
.
doccano/app/app/settings.py
有两个数据库和一个到路由器的链接:
AuthRouter.py
看起来像这样: