0

这是问题所在:

供你参考:

http://i.stack.imgur.com/mmrNH.jpg

数据库条目 1,2 和 3 是使用 jdbc1.2 使用 jython 2.2.1 创建的。数据库条目 4 是使用 vb 制作的,旧的要使用 odbc 替换的程序。

我们发现,如果我直接从 SQL Server Enterprise Manager 软件将 jython 和 vb MailBody 条目复制并粘贴到写字板,它会以正确的换行符完美输出格式。如果我将每个文件的字节与十六进制编辑器或 KDiff3 进行比较,它们的二进制相同。

有一个使用此数据的第 3 方程序。可悲的是,第 3 方程序读取数据,并且对于条目 1 到 3,它显示的数据不带行返回。尽管对于条目 4,它正确地格式化了文本。作为我们在图片中看到的进一步证明,数据库中的数据显示方式不同。不知何故,行返回被保留在数据库中用于 vb 条目,但忽略了 jython 条目。如果我单击条目 4 的“MailBody”字段,我可以按下我可以看到电子邮件的其余部分。而 jython 的数据显示在一行中。

什么给了,我错过了什么,我该如何处理?这是我实际将其发送到数据库的代码片段。

编辑:仅供参考:请忽略“已处理”列中的差异,这是无关紧要的。编辑:我想做的是让 jython 程序以与 vb 程序相同的方式输入数据。这样第 3 方程序就会出现并正确显示数据。所以看起来“MailBody”中的每个条目都会显示“这只是一个测试!” 然后下一行“等”,所以如果我要进行屏幕转储,所有条目都将类似于数据库条目 4。

解决了

将 _force_CRLF 添加到组合中:

def _force_CRLF(self, data):
    '''Make sure data uses CRLF for line termination.
    Nicked the regex from smtplib.quotedata. '''
    print data
    newdata = re.sub(r'(?:\r\n|\n|\r(?!\n))', "\r\n", data)
    print newdata
    return newdata

def _execute_insert(self):
    try:
        self._stmt=self._con.prepareStatement(\
            "INSERT INTO EmailHdr (EntryID, MailSubject, MailFrom, MailTo, MailReceive, MailSent, AttachNo, MailBody)\
             VALUES (?, ?, ?, ?, ?, ?, ?, cast(? as varchar (" + str(BODY_FIELD_DATABASE) + ")))")
        self._stmt.setString(1,self._emailEntryId)
        self._stmt.setString(2,self._subject)
        self._stmt.setString(3,self._fromWho)
        self._stmt.setString(4,self._toWho)
        self._stmt.setString(5,self._format_date(self._emailRecv))
        self._stmt.setString(6,self._format_date(self._emailSent))
        self._stmt.setString(7,str(self._attachmentCount))
        self._stmt.setString(8,self._force_CRLF(self._format_email_body()))
        self._stmt.execute()
        self._prepare_inserting_attachment_data()
        self._insert_attachment_data()
    except:
        raise

def _format_email_body(self):
    if not self._emailBody:
        return "could not extract email body"
    if len(self._emailBody) > BODY_TRUNCATE_LENGTH:
        return self._clean_body(self._emailBody[:BODY_TRUNCATE_LENGTH])
    else:
        return self._clean_body(self._emailBody)

def _clean_body(self,dirty):
    '''this method simply deletes any occurrence of an '=20' that plagues my output after much testing this is not related to the line return issue, even if i comment it out I still have the problem.''' 
    dirty=str(dirty)
    dirty=dirty.replace(r"=20","")
    return r"%s"%dirty
4

2 回答 2

1

您应该查看 quopri 模块(以及其他有关电子邮件的模块),因此您不必使用肮脏的技巧作为_clean_body

于 2008-12-12T14:06:49.047 回答
1

我建议在您的程序中添加一个调试输出,在插入 DB 之前转储字符代码。Jython 有可能用单个字符替换 CrLf 对,并且在写入 DB 时不会恢复它。

于 2008-12-10T05:36:27.200 回答