我一直在尝试使用AVSpeechSynthesizer
从UIWebView
. 我想做的方式是:
- 使用 JS 获取屏幕顶部可见元素(即 p、h1、h2、h3 等)
- 使用 JS 将元素拆分为单词数组。
- 一个接一个地,每个单词都被突出显示(JS)并使用
AVSpeechSynthesizer
.
现在的问题是,由于每个单词一次只说一个,所以它说话非常突然,就像单个单词而不是句子一样。我想要的是,如果能让整个元素说话AVSpeechSynthesizer
并了解说话的时间有多长,以便同步突出显示或以某种方式使现在正在说出的个人单词保持为一个句子。