0

任何人都知道如何阅读Epub 文件并能够搜索和定位标签?我正在使用 VB.Net,但我不知道如何阅读 EPub。

或者只是帮我解压缩或提取某个文件

这些是我的代码

Dim ZipToUnpack As String = txtPath.Text
Dim TargetDir As String = txtTXT.Text
Console.WriteLine("Extracting file {0} to {1}", ZipToUnpack, TargetDir)
Using zip1 As ZipFile = ZipFile.Read(ZipToUnpack)
'AddHandler zip1.ExtractProgress, AddressOf MyExtractProgress
Dim a As ZipEntry
For Each a In zip1
a.Extract(TargetDir, ExtractExistingFileAction.OverwriteSilently)
Next
MsgBox("Done")
getFiles()
End Using


For j As Integer = 0 To ListView1.Items.Count - 1
Dim k As StreamReader = New StreamReader(New FileStream(Path.Combine(ListView1.Items(j).Tag, ListView1.Items(j).Text), FileMode.Open, FileAccess.Read, FileShare.Read))
k.ReadLine()

你能帮我下一步如何阅读所有的html并计算img标签吗

4

1 回答 1

1

您将要采取的步骤,以与语言无关的方式:

  1. 解压 .epub 文件

  2. 阅读 META-INF/container.xml 文件,找到根文件标签。这为您提供了声明包内容的 .opf 文件的位置。(我将其称为 content.opf,但它可能有另一个名称。)

  3. 读取并解析 content.opf(它也是 XML),并列出该<manifest>部分中的每个文件和路径。这是包中每个文件的列表。

  4. 对于该清单列表中的每个 .xhtml 文件(即具有媒体类型“application/xhtml+xml”的文件),解析 HTML,查找<img>标签。

于 2012-10-23T01:06:22.367 回答