素材上传接入
研究者可通过手机端上传采录的音视频语料素材,统一进入后续处理流程。
- 支持音视频素材接入
- 面向语料整理场景

“燃语料”平台是一款基于人工智能技术方案的多模态语料自动转写标注产品,现阶段主要聚焦语料加工处理的降本提效。研究者通过手机端上传采录的音视频语料素材后,平台可结合声纹识别与自动转写能力完成区分说话人的语料初步整理。
平台支持语料文本、音视频与时间轴的同步对应查看。人工校验标注完成后,系统可将结果按照 TALKBANK 中 clan 程序要求的格式导出,以供后续的数据分析、归档与研究使用。
目前平台支持 iPhone、iPad、Mac(Apple 芯片版)等苹果系统设备,操作方式简洁,对初学者友好。更多功能说明与更新信息可通过燃语料公众号获取。

更多功能介绍与更新信息,请关注公众号。
补充平台的自动处理能力、适用设备与研究场景。
平台的机器自动转写能力可快速完成内容转录、说话人标注及时间轴对齐等初加工步骤。研究者可在此基础上继续完成结果校验、标签补充,以及面向不同研究目标的细致转写工作。
燃语料以服务语言学研究为出发点,兼顾高效率、高准确率、低门槛与低成本,也希望为高质量语料的共建共享、科研数据复核与后续应用提供支撑。
燃语料多模态语料自动转写标注平台围绕多模态语料处理流程组织核心功能。
研究者可通过手机端上传采录的音视频语料素材,统一进入后续处理流程。
结合自动转写能力完成内容转录,优先处理语料初加工中的高重复工作。
通过声纹识别辅助区分不同说话人,生成更清晰的会话结构。
语料文本、音视频和时间轴可对应查看,便于回听、比对和定位内容。
支持对机转结果进行二次校验,修改文本和说话人标签,并补充更细的标注信息。
人工校验完成后,可按 TALKBANK 中 clan 程序要求导出结果,便于后续分析与归档。
从数据导入、自动处理到人工标注和结构化导出,形成清晰的处理链路。
音频、视频、文本统一接入。
进入同一处理流程。
执行转写、分析与预处理。
提升前置处理效率。
进行标注校对与质量复核。
保证结果一致性。
输出标准化结果。
便于训练和系统接入。