php - domDocument 编码与数据库不匹配

Question

我正在使用 domDocument 来查找 html 标签。

 $mensaje = "Te informamos que la parada <b>Plaza de la Estación</b> está
   próxima a vaciarse, el día <b>2013-04-22</b> a las <b>17:34:50</b>.";

$dom = new domDocument('1.0', 'utf8_general_ci');
          // load the html into the object ***/
          $dom->loadHTML($mensaje);

          //discard white space
          $dom->preserveWhiteSpace = false;
          $nodeList= $dom->getElementsByTagName('b'); // here u use your desired tag

          $items = array();
          for($i=0; $i < $nodeList->length; $i++) {
                    $node = $nodeList->item($i);
                    $items[] = trim($node->nodeValue);
          }
          var_dump($items);

$mensaje 是从我的数据库中提取的，这个字段是 utf8_general_ci，但是它失败了：

array(3) { 
 [0]=> string(21) "Plaza de la EstaciÃ³n" 
  [1]=> string(10) "2013-04-22" 
  [2]=> string(8) "17:34:50" }

第一个元素的编码错误。

我该如何解决这个问题？

score 1 · Accepted Answer

创建DOMDocument对象时指定的编码对 XML 文档无效。utf8_general_ci是一个 MySQL 编码。将其替换为UTF-8。
还要确保您的 php 文件的编码设置为 UTF-8。

php - domDocument 编码与数据库不匹配

1 回答 1

Related

Reference