0

我只想要一个建议或一种我可以处理情况的方法

我有一个模块,我曾经在其中爬取网站并让当前电影在附近的电影院放映。我有两张桌子 1) 一张是给电影的,另一张是给电影院看的,电影首先插入到电影表中。

现在我已经在每天早上的 cron Job 上设置了我的文件。所以在我的代码中,我首先删除两个表中的所有数据并插入新数据。但是这样一来,我通常会放弃最终用户对该特定电影给出的所有评分。

为了克服这种情况,我想到了一些解决方案

我创建了一个新查询

INSERT INTO jos_movie (movie_name, language, cast,movie_release,director,rating,rating_count,movie_ids)
SELECT * FROM (SELECT 'test','null','yahoo','Dec 21, 2012','himmat',250,230,'43677') AS tmp
WHERE NOT EXISTS (
    SELECT movie_name FROM jos_movie WHERE movie_name = 'test')

同样,我也为电影院桌创建了相同的方法。

这样,它将检查并且不会覆盖表中的电影。但是这种方法存在一些问题。如果电影院所有者确实删除了该特定电影的节目,例如“测试”。然后通过上面的查询它不会删除那个。它会留在那里。

对不起我的主题行,因为我无法为这个问题考虑好的主题行。

那么我怎样才能获得一个结果,以便现有电影如果在表中就不会得到更新,如果它不在我的脚本的抓取结果数组中,就会被删除。

这是我的表格结果

这是电影表结果

在此处输入图像描述

这是电影院的桌子

在此处输入图像描述

这是我使用的代码。

$con=mysql_connect('localhost','test','test');
mysql_select_db('test',$con);

// Use cURL to get the RSS feed into a PHP string variable.
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,'myrsslink.xml');
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$xml = curl_exec($ch);
curl_close($ch);

$arrData = array();
// Create an array of item elements from the XML feed.
$news_items = element_set('item', $xml);
$del_movie = "delete from jos_movie";
mysql_query($del_movie);

$del_cinema = "delete from jos_cinema";
mysql_query($del_cinema);

foreach($news_items as $item) {
    $title = value_in('title', $item);
    $url = value_in('link', $item);
    $cast = value_in('description', $item);
    //curl_setopt($ch, CURLOPT_URL,$url);
    //curl_setopt($ch, CURLOPT_HEADER, false);
    //curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
    //$html = curl_exec($ch);
    $arrTitle = explode('-',$title);
    $html = file_get_html($url);
    $htmlShowTime = '';

    // find all span tags with class=gb1 moviTimes moviTmngBox
    foreach($html->find('ul[style=line-height:2em;]') as $e)
        $htmlShowTime = $e->plaintext;

    $movie_name = $arrTitle[0];

    $apiKey = '30f44b6ef9472d414e50d2acaa058b60';
    $url = sprintf('http://api.themoviedb.org/2.1/Movie.search/en/xml/%s/"%s"',$apiKey,rawurlencode(trim($movie_name)));

    //$xml = simplexml_load_file("http://api.themoviedb.org/2.1/Movie.search/en/xml/accd3ddbbae37c0315fb5c8e19b815a5/"$movie_name"");
    $xml = simplexml_load_file($url);
    $movies = $xml->movies->movie;
   foreach ($movies as $movie){
        $arrMovie_id = $movie->id;
    }
    $arrStr = explode(':',$htmlShowTime);
    $release = substr($arrStr[3],0,strlen($arrStr[3])-8);
    $director = substr($arrStr[5],0,strlen($arrStr[5])-11); 

    $sql_movie = "insert into jos_movie(movie_name,language,cast,movie_release,director,rating,rating_count,movie_ids)values('$movie_name','null','$cast','$release','$director',250,230,'$arrMovie_id')";
    //echo $sql.'<br>';
   // echo $sql_movie;

    mysql_query($sql_movie);

    $sqlCount = 'select max(id) from jos_movie' or die("cannot select DB");
    $data = mysql_query($sqlCount);
    echo $data;
    print_r($data);
    $result = mysql_fetch_array($data);
    $id = $result[0];
    echo '<br>'.$id.'<br>'; 

    //$id = mysql_insert_id();
    //echo $id;

        // find all span tags with class=gb1
    foreach($html->find('div.moviTmngBox') as $e){
        $tagTitle =  $e->find('a',0);
        $tagTime  = $e->find('div.moviTimes',0);
        $name = $tagTitle->title;
        $time = $tagTime->innertext;

    $trimName = '';
    $temName = strtolower(str_replace(' ','',$name));

    if(strpos($temName,'indraaudi1') !== false)
      $trimName = 'Indra Audi 1' and  $cinemaId = '1' and $long='32.726602' and $lat='74.857026';
    elseif(strpos($temName,'indraaudi2') !== false)
     $trimName = 'Indra Audi 2' and $cinemaId = '2'and $long='32.726602' and $lat='74.857026';
    elseif(strpos($temName,'indraaudi3') !== false)
      $trimName = 'Indra Audi 3'and $cinemaId = '3' and $long='32.726602' and $lat='74.857026';
    elseif(strpos($temName,'apsra') !== false)
      $trimName = 'Apsra' and $cinemaId = '4' and $long='32.700314' and $lat='74.858023';
    else{
        $trimName = trim(substr($name,18,strlen($name))) and $cinemaId = '5' and $long='32.7300' and $lat='74.8700' ;
    }

        //echo $tagTime->innertext.'<br/>';
        $sql = "insert into jos_cinema(cinema_name,show_time,movie_id,cinemaId,logitude,latitude)values('$trimName','$time',$id,$cinemaId,$long,$lat)";
        //echo $sql.'<br/>';
        mysql_query($sql);
        //$arrTem = array($tagTitle->title,$tagTime->innertext);

    }

}//end rss feed loop

?>

请注意,我正在插入电影评分的默认值。

谢谢

4

3 回答 3

1

可能最好搭配临时桌子。

1)加载所有数据

2)删除临时表中不存在的所有内容

3)更新在哪里存在/加入你的临时表

4)在正确的表中插入不存在的地方

最后 2 个可能使用 MERGE 语句完成,或者更好的是,RDBMS 附带的 ETL 工具

不过老实说,您的数据模型并不是特别清楚。

于 2013-05-06T05:46:57.377 回答
1

理想情况下,评级信息应该已经分离,以便电影评级信息可以与电影信息分离。但是,如果这不是您可以在您的情况下实施的,我将采取以下两个步骤。

识别已移除的电影并将其从电影表中删除(这里假设您的新电影信息在 movie_new 表中)

DELETE y.*
  FROM
      (
       SELECT a.movie_name
         FROM jos_movie a
         LEFT OUTER JOIN movie_new b
           ON a.movie_name = b.movie_name
        WHERE b.movie_name IS NULL
      ) x, tbl_issue y
WHERE x.movie_name = y.movie_name

将新电影添加到电影表。

INSERT INTO jos_movie
SELECT b.*
  FROM jos_movie a
 RIGHT OUTER JOIN movie_new b
    ON a.movie_name = b.movie_name
 WHERE a.movie_name IS NULL

我猜你可以对另一张桌子采取相同的步骤。

于 2013-05-06T05:51:06.673 回答
1

首先创建一个好的数据库结构:-

  1. 创建一个 ID 以唯一地定义表中的每部电影。
  2. 规范化您的表结构。意味着将电影详细信息和活动电影列表保存在单独的表中 (active_movies)。按照以下链接获取更多信息 MYSQL 中的规范化

  3. 无需为同一部电影一次又一次地更新完整的行,只需更新活动电影表即可。

  4. 保留所有电影的数据备份,这可以帮助您将来显示一年内发行的所有电影的列表和详细信息,或者包括特定演员,或评分高于 4 等。

一个好的数据库结构将使您的代码更简单且易于实现。很少有更多有用的链接 http://searchbusinessintelligence.techtarget.in/tutorial/Database-normalization-in-MySQL-Four-quick-and-easy-steps

于 2013-05-06T05:45:01.350 回答