我已经在 Centos 上使用Confluence启动了一个服务器,并创建了一个带有表格的页面。
现在我想连接到我的页面,然后在那里解析 html 并找到行和列,但我无法连接到页面。
我的页面位于:http://localhost:8090/display/TEST/Confluence
如何连接到我的页面并解析 HTML?
我已经在 Centos 上使用Confluence启动了一个服务器,并创建了一个带有表格的页面。
现在我想连接到我的页面,然后在那里解析 html 并找到行和列,但我无法连接到页面。
我的页面位于:http://localhost:8090/display/TEST/Confluence
如何连接到我的页面并解析 HTML?
您可以使用 confluenca api 获取页面 ID
from atlassian import Confluence
space = '~MYSPACE'
title_parent = 'PARENT_PAGE_ID'
p_id = confluence.get_page_id(space, title_parent)
print(p_id)
title = 'New page'
body = 'This is the body of a new page'
status = confluence.create_page(space, title, body, parent_id=p_id, type='page',
representation='storage')
print(status)
最好提出两个请求。第一个将是一个返回页面 ID 的搜索,而后者将返回其内容。
import requests
url = confluence_host + '/rest/api/content/'
res = requests.get(url=url + 'search',
params={'cql': 'space="TEST" AND title="Page Titile'})
page_id = res.json()['results'][0]['id']
import requests
url = confluence_host + '/rest/api/content/'
page = requests.get(url=url + page_id,
params={'expand': 'body.storage'}).json()
html = page['body']['storage']['value']
在此处查看 Atlassian 示例。要更新您的页面,您需要知道您的页面 ID。