我需要做一个项目,上面写着:
抓取和展示
获取此页面 - http://directory.thesun.co.uk/find/uk/computer-repair
使用 Scrapy 编写一个爬虫,它将提取从第 1 页到第 10 页列出的所有业务。将这些数据存储到 MySQL 中。创建一个存储以下属性的架构:
公司名称、地址(可多张地址)、关于、照片(可多张照片)、电话号码、网站 URL
真正尝试并开发一个好的模式非常重要。这将测试您的 RDBMS 概念,这是非常必要的。
使用 Django 创建一个应用程序,该应用程序将允许用户查看上述数据。不需要数据编辑。此应用程序的外观和工作方式应与原始 Sun 目录站点非常相似。
但是我的models.py 有问题。这是它的代码:
from django.db import models
class Directory(models.Model):
Bussiness_name = models.CharField(max_length=300)
Description = models.CharField(max_length=900)
Number = models.CharField(max_length=100)
Web_url = models.URLField(max_length=800)
def __unicode__(self):
return self.Bussiness_name+" / "+self.adress_name+" / "+self.Description+" / "+self.Number+" / "+self.Web_url+" / "+self.Photo_name
class Adress:
directory = models.ForeignKey(Directory)
adress_name = models.CharField(max_length=300)
class Photos:
directory = models.ForeignKey(Directory)
Photo_path = models.CharField(max_length=100)
Photo_name = models.CharField(max_length=100)