我有一个项目,我在其中实现了一个搜索引擎。我们的指南建议我们实现 O' Reilly 的 Collective Intelligence 2007 书中给出的代码。这是网页被索引的代码的一部分。我们正在使用 Sqlite3 数据库。我在代码的最后一部分出错,即使经过大量研究,我也没有成功。
def addtoindex(self,url,soup):
if self.isindexed(url): return
print 'Indexing '+url
# Get the individual words
text=self.gettextonly(soup)
words=self.separatewords(text)
# Get the URL id
urlid=self.getentryid('urllist','url',url)
# Link each word to this url
for i in range(len(words)):
word=words[i]
if word in ignorewords: continue
wordid=self.getentryid('wordlist','word',word)
self.con.execute("insert into wordlocation(urlid,wordid,location)\values (%d,%d,%d)" % (urlid,wordid,i))
我在最后一行收到以下错误:
sqlite3.OperationalError:无法识别的令牌:“[一些我不知道的符号]”