我认为,另一种提问方式是,“Android 手机/平板电脑/平板电脑上的麦克风是单向的还是全向的?”
我想知道 Speech-to-Text 应用程序是否可以在对话中拾取多个发言者,或者它在功能上是否仅限于对着麦克风讲话的人,例如当 IPhoniacs 问“Siri”问题时,或者当一个年轻人练习他的演绎时手持设备的葛底斯堡演说?
我认为,另一种提问方式是,“Android 手机/平板电脑/平板电脑上的麦克风是单向的还是全向的?”
我想知道 Speech-to-Text 应用程序是否可以在对话中拾取多个发言者,或者它在功能上是否仅限于对着麦克风讲话的人,例如当 IPhoniacs 问“Siri”问题时,或者当一个年轻人练习他的演绎时手持设备的葛底斯堡演说?
我想知道 Speech-to-Text 应用程序是否可以在对话中接听多个发言者
Speech-to-text 可以选择多个扬声器,但问题是智能手机上的麦克风非常有限,并且经过专门调整以消除周围的噪音和周围的语音。API 中对此没有任何控制。手机只擅长录制单个扬声器。
宣布了这样的应用程序:
http://www.gridspace.com/memo-mobile
但我严重怀疑它们是否会交付。
还是它在功能上仅限于对着麦克风讲话的人,例如当 IPhoniacs 提出“Siri”问题时,或者当一个年轻人手持设备练习他的葛底斯堡演说时?
可以在手机上运行扬声器识别软件,因此它可能会识别所有者并忽略其他人,如果您正在寻找的话。它也可能会学到一些演讲者。