1

我使用 Pandas 创建了一些虚构但具有代表性的临床试验类型数据,现在在 ReportLab 中进行一些测试报告。

数据有一个块(约 50 行),其中治疗列是“安慰剂”,而治疗列是“活动”的相同数量。我只是想在第一组使用“治疗组:安慰剂”的子标题和第二组的“治疗组:有效”的子标题列出数据。

有一些关于类似主题的热门文章,实际上我使用了建议的技术之一,即使用partialfrom扩展标头函数的参数functools

title1 = "ACME Corp                                                                                                              CONFIDENTIAL"
title2 = "XYZ123 / Anti-Hypertensive                                                                                                    Draft"
title3 = "Protocol XYZ123"

title4 = "Study XYZ123"
title5 = "Listing of Demographic Data by Treatment Arm"
title6 = "All subjects"
def title(canvas, doc, bytext):
    canvas.saveState()
    canvas.setFont(styleN.fontName, styleN.fontSize)
    canvas.drawString(DOCMARGIN, PAGE_HEIGHT*.975, title1)
    canvas.drawString(DOCMARGIN, PAGE_HEIGHT*.950, title2)
    canvas.drawString(DOCMARGIN, PAGE_HEIGHT*.925, title3)
    canvas.drawCentredString(PAGE_WIDTH/2.0, PAGE_HEIGHT*.900, title4)
    canvas.drawCentredString(PAGE_WIDTH/2.0, PAGE_HEIGHT*.875, title5)
    canvas.drawCentredString(PAGE_WIDTH/2.0, PAGE_HEIGHT*.850, title6)
    canvas.drawString(DOCMARGIN, PAGE_HEIGHT*.825, "Treatment Group:" + bytext)
    canvas.restoreState()

然后调用如下。n_groups来自摘要查询的值为 2,0 映射到“安慰剂”,1 映射到活动。

def build_pdf(doc): 
    ptemplates = []
    for armcd in range(n_groups):
        ptemplates.append(PageTemplate(id = 'PT' + str(armcd), frames = [dataFrame,],
                     onPage = partial(title, bytext=t_dict[armcd]),
                     onPageEnd = foot))
    doc.addPageTemplates(ptemplates)

    elements = []
    for armcd in range(n_groups):
        elements.append(NextPageTemplate('PT' + str(armcd)))  
        sublist = [t for t in lista if t[0] == (armcd+1)]
        sublist.insert(0,colheads)
        data_table = Table(sublist, 6*[40*mm], len(sublist)*[DATA_CELL_HEIGHT], repeatRows=1)
        data_table.setStyle(styleC)
        elements.append(data_table)
        elements.append(PageBreak())
    doc.build(elements)

该报告产生 6 页。安慰剂数据的前 3 页是正确的,活动数据的第 5 页和第 6 页是正确的,但是第 4 页 - 应该是第二个“活动”组的第一页有副标题“治疗组:安慰剂”。

我已经多次重新组织语句的顺序,但无法让第 4 页正确地副标题。任何帮助、建议或魔法将不胜感激。

[编辑 1:示例数据结构] 数据的“顶部”开头为:

[
   [1, 'Placebo', '000001-000015', '1976-09-20', 33, 'F', 'Black'],
   [1, 'Placebo', '000001-000030', '1959-04-26', 50, 'M', 'Asian'],
   [1, 'Placebo', '000001-000031', '1946-02-07', 64, 'F', 'Asian'],
   [1, 'Placebo', '000001-000046', '1947-11-08', 62, 'M', 'Asian'],

等50行,然后继续

   [2, 'Active', '000001-000002', '1962-02-28', 48, 'F', 'Black'],
   [2, 'Active', '000001-000008', '1975-10-20', 34, 'M', 'Black'],
   [2, 'Active', '000001-000013', '1959-01-19', 51, 'M', 'White'],
   [2, 'Active', '000001-000022', '1962-01-12', 48, 'F', 'Black'],
   [2, 'Active', '000001-000036', '1976-10-17', 33, 'F', 'Asian'],
   [2, 'Active', '000001-000045', '1980-12-31', 29, 'F', 'White'],

另外50。

插入的列标题是:

['Treatment Arm Code',
        'Treatment Arm',
        'Site ID - Subject ID',
        'Date of Birth',
        'Age (Years)',
        'Gender',
        'Ethnicity'],

[编辑 2:解决方案 - 移动PageBreak()并使其有条件:]

def build_pdf(doc): 
    ptemplates = []
    for armcd in range(n_groups):
        ptemplates.append(PageTemplate(id = 'PT' + str(armcd), frames = [dataFrame,],
                     onPage = partial(title, bytext=t_dict[armcd]),
                     onPageEnd = foot))
    doc.addPageTemplates(ptemplates)

    elements = []
    for armcd in range(n_groups):     
        elements.append(NextPageTemplate('PT' + str(armcd)))
        if armcd > 0:
            elements.append(PageBreak())
        sublist = [t for t in lista if t[0] == (armcd+1)]
        sublist.insert(0,colheads)
        data_table = Table(sublist, 6*[40*mm], len(sublist)*[DATA_CELL_HEIGHT], repeatRows=1)
        data_table.setStyle(styleC)
        elements.append(data_table)

    doc.build(elements)
4

0 回答 0