3

我想删除我的谷歌应用脚​​本中的 html 格式。我目前正在搜索电子邮件并将结果打印到谷歌电子表格。我想知道是否有办法替换文本。我知道正则表达式,但我认为它不适用于 getBody 函数。

我非常感谢您对此事的一些反馈或帮助。

代码:

function Search() {

var sheet   = SpreadsheetApp.getActiveSheet();
var row     = 2;

// Clear existing search results
sheet.getRange(2, 1, sheet.getMaxRows() - 1, 4).clearContent();

// Which Gmail Label should be searched?
var label   = sheet.getRange("F3").getValue();

// Get the Regular Expression Search Pattern
var pattern = sheet.getRange("F4").getValue();

// Retrieve all threads of the specified label
var threads = GmailApp.search("in:" + label);

for (var i = 0; i < threads.length; i++) {

var messages = threads[i].getMessages();

for (var m = 0; m < messages.length; m++) {
 var msg = messages[m].getBody();

// Does the message content match the search pattern?
if (msg.search(pattern) !== -1) {


 // Print the message subject
 sheet.getRange(row,3).setValue(messages[m].getBody());
4

2 回答 2

3

替换这个:

// Print the message subject
sheet.getRange(row,3).setValue(messages[m].getBody());

有了这个:

// Print the message subject
sheet.getRange(row,3).setValue(getTextFromHtml(messages[m].getBody()));

getTextFromHtml()功能已根据此答案进行了改编,并增加了一些基本格式的处理(编号和项目符号列表,分段符)。

function getTextFromHtml(html) {
  return getTextFromNode(Xml.parse(html, true).getElement());
}

var _itemNum; // Used to lead unordered & ordered list items.

function getTextFromNode(x) {
  switch(x.toString()) {
    case 'XmlText': return x.toXmlString();
    case 'XmlElement':
      var name = x.getName().getLocalName();
      Logger.log(name);
      var pre = '';
      var post = '';
      switch (name) {
        case 'br':
        case 'p':
          pre = '';
          post = '\n';
          break;
        case 'ul':
          pre = '';
          post = '\n';
          itemNum = 0;
          break;
        case 'ol':
          pre = '';
          post = '\n';
          _itemNum = 1;
          break;
        case 'li':
          pre = '\n' + (_itemNum == 0 ? ' - ' : (' '+ _itemNum++ +'. '));
          post = '';
          break;
        default:
          pre = '';
          post = '';
          break;
      }
      return pre + x.getNodes().map(getTextFromNode).join('') + post;
    default: return '';
  }
}
于 2013-06-15T03:31:36.347 回答
2

从这个答案:Google Apps Scripts - Extract data from gmail into a spreadsheet

您可以完全放弃 getTextFromHTML 函数,只需使用 getPlainBody(); 而不是 getBody();。

于 2016-05-23T22:11:19.140 回答