0

I have a ruby script that creates a HTML file as the output with certain letters coloured.

e.g.

<p>
        <b>>aug3me.g5.t1</b> has a signal p with a cleavage site between positions 19 and 20.<br>
        <b class="SignalP">MLRSMMLMIAMGCFLNAFG</b>QSGQELE<b class="motif_site">KR</b>VI<b class="motif_site">KNAR</b>QLIYEG<b class="motif_site">KR</b>SGEGYFSKDGK<b class="motif_site">HLIFQSER</b>EEENPYYQIYILDLESGDINRVSPGQGKTTCSYFDWSSDNNVLFGSTHHDPKAKEKQQAELDF<b class="motif_site">RASGKKRR</b>YSWDYDKEMDIFSAN<b class="motif_site">RDGSNVKR</b>ITTEEGYDAEGSYSPDG<b class="motif_site">KK</b>IAFCSLRDAYN<b class="motif_site">KK</b>LSEKEIKTLEVDAAYFGEIYIMDADGSNQ<b class="motif_site">KR</b>LTNVPEPVRITHTDGFDGLPVFSPNGKNIAWTSVRTSD<b class="motif_site">KK</b>SQIFYASWDHQAALSLLKQAPAKGQDAKDPNFTGEIKSDEIKSKVAYLASDELEGRMTGSEGI<b class="motif_site">KK</b>ASDYITGQF<b class="motif_site">KK</b>IGLNSIESREEYLQEFPFVSSVEVNAAGTSFSTTN<b class="motif_site">KK</b>KPKAWVLYENFVPLPFSMNGEFEGEVVFAGYGIKTPDKSEVEYNSYANIEVKDKAVMILFDVPPHFNDDEEKELI<b class="motif_site">RYASPR</b>Y<b class="motif_site">KALVAR</b>ELGAKAVIFISE<b class="motif_site">REREFR</b>GVSKDNVPGNAGILALKVKSDLANEMLKSKETDFEKVKTQFENYNPHSENEFPLPGQTIGITTQLDKVESSDNNVIGILYADEPTDHYLMVGAHYD<b class="motif_site">HLGR</b>GEAGTLAHGEEKEEIHNGADDNASGTAAVMELAEYFVQLKNENPGSLTKNLLFALWSGEEMGLVGSAHYTKQSSKEIEGMDAYLNFDMIGMLNDNKLILQGLGSSPAWNKIVE<b class="motif_site">KK</b>NVAAGFDLTLQDDPYVPTDGMSFYQAGVPMLCFFSGIHDYYH<b class="motif_site">KPTDDIER</b>LNYEGAERIIKFSAEIIKELMKVDTLAYA<b class="motif_site">KVEMVKNR</b>AAGSKGFSVYLGTIPDYVAEVEGV<b class="motif_site">KLSGVR</b>AGGPAEKAVFRPN<b class="motif_site">KALR</b>LYGLNPLRGPH
    </p>

With the above sequence, certain residues (letters) are coloured in colour or another etc.

I need to make a script that makes a text file of some kind (ideally a .doc file) that has all these formattings.

Is it possible to make a script to create a word document with formatting. If so, how would I approach this?

4

1 回答 1

1

对的,这是可能的。有困难的方法和简单的方法。

艰辛的道路

使用可以使用 WordprocessingML 创建一个 Microsft Word 文档。我过去曾使用 XML 样式表将 XML 输出转换为模板,也使用 C# 从头开始​​构建它们。(参见http://msdn.microsoft.com/en-us/library/office/aa212812(v=office.11 ​​).aspx和http://msdn.microsoft.com/en-us/library/bb264572(v =office.12).aspx有关格式的更多详细信息)。

如果您可以在 Word 中创建具有所需样式的模板。将扩展名更改为.zip并解压缩。document.xml是文档,它可以为您提供可以使用的基本 XML 文件。

简单的方法

如果 html 文件是“独立的”,包含所需的所有样式,您可以作弊并给 html 文件一个.doc扩展名。Word 会将 HTML 呈现为 word 文档。

于 2013-08-18T21:11:35.917 回答