我正在开发一个 Java 应用程序来将语音转换为文本。我使用 Java 语音 API 将语音转换为文本,该 API 记录音频文件,然后将其转换为 FLAC 文件,将其发布到谷歌,响应被带到一个字符串。摆在我面前的挑战是,我需要在音频文件中为每个单独的语句(假设检测到句号)打上时间戳。
如何才能做到这一点?我是 Java 新手。
我的主文件:
import com.darkprograms.speech.microphone.Microphone;
import com.darkprograms.speech.recognizer.Recognizer;
import javax.sound.sampled.AudioFileFormat;
import javax.swing.*;
import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
public class DoItAll extends JFrame {
JButton stop = new JButton("Stop");
JButton run = new JButton("Run");
JButton process = new JButton("Process");
Microphone microphone = new Microphone(AudioFileFormat.Type.WAVE);
Recognizer recognizer = new Recognizer();
String audioFile = "c:/eclipse/f.wav";
public DoItAll(){
stop.addActionListener(new ActionListener() {
public void actionPerformed(ActionEvent e) {
microphone.close();
}
});
run.addActionListener(new ActionListener() {
public void actionPerformed(ActionEvent e) {
try {
microphone.captureAudioToFile(audioFile);
} catch (Exception e1) {
e1.printStackTrace(); //To change body of catch statement use File
JOptionPane.showMessageDialog(null, e1.getMessage());
}
}
});
process.addActionListener(new ActionListener() {
public void actionPerformed(ActionEvent e) {
String response = "error";
try {
response = recognizer.getRecognizedDataForWave(audioFile).getResponse();
} catch (Exception e1) {
e1.printStackTrace();
response = e1.getMessage();
}
JOptionPane.showMessageDialog(null, response);
}
});
getContentPane().setLayout(new BoxLayout(getContentPane(), BoxLayout.X_AXIS));
getContentPane().add(run);
getContentPane().add(stop);
getContentPane().add(process);
setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE);
pack();
show();
}
public static void main(String[] args) {
new DoItAll();
}
}
我的语音 API 来自这个链接。
感谢帮助。