RAN YULIAO INTRO
燃语料 Logo

燃语料简介

“燃语料”平台是一款基于人工智能技术方案的多模态语料自动转写标注产品,现阶段主要聚焦语料加工处理的降本提效。研究者通过手机端上传采录的音视频语料素材后,平台可结合声纹识别与自动转写能力完成区分说话人的语料初步整理。

平台支持语料文本、音视频与时间轴的同步对应查看。人工校验标注完成后,系统可将结果按照 TALKBANK 中 clan 程序要求的格式导出,以供后续的数据分析、归档与研究使用。

目前平台支持 iPhone、iPad、Mac(Apple 芯片版)等苹果系统设备,操作方式简洁,对初学者友好。更多功能说明与更新信息可通过燃语料公众号获取。

燃语料公众号二维码
公众号
燃语料公众号

更多功能介绍与更新信息,请关注公众号。

重点说明
  • 支持 iPhone、iPad、Mac(Apple 芯片版)
  • 支持说话人区分与时间轴对齐
  • 支持 TALKBANK / clan 格式导出
  • 更多说明请关注燃语料公众号
Article

更多说明

补充平台的自动处理能力、适用设备与研究场景。

平台的机器自动转写能力可快速完成内容转录、说话人标注及时间轴对齐等初加工步骤。研究者可在此基础上继续完成结果校验、标签补充,以及面向不同研究目标的细致转写工作。

燃语料以服务语言学研究为出发点,兼顾高效率、高准确率、低门槛与低成本,也希望为高质量语料的共建共享、科研数据复核与后续应用提供支撑。

自动转写与说话人识别
音视频与文本时间轴对齐
人工校验与标签编辑
结构化结果导出
Capabilities

核心能力

燃语料多模态语料自动转写标注平台围绕多模态语料处理流程组织核心功能。

INGEST

素材上传接入

研究者可通过手机端上传采录的音视频语料素材,统一进入后续处理流程。

  • 支持音视频素材接入
  • 面向语料整理场景
ASR

自动转写

结合自动转写能力完成内容转录,优先处理语料初加工中的高重复工作。

  • 快速生成初步文本
  • 降低人工转写成本
SPK

说话人区分

通过声纹识别辅助区分不同说话人,生成更清晰的会话结构。

  • 支持说话人识别
  • 自动整理发言轮次
SYNC

时间轴同步查看

语料文本、音视频和时间轴可对应查看,便于回听、比对和定位内容。

  • 支持同步反复播放
  • 支持时间轴对齐查看
EDIT

校验与标签编辑

支持对机转结果进行二次校验,修改文本和说话人标签,并补充更细的标注信息。

  • 文本与标签修改
  • 适配细致转写需求
EXPORT

结构化导出

人工校验完成后,可按 TALKBANK 中 clan 程序要求导出结果,便于后续分析与归档。

  • 支持 TALKBANK / clan
  • 便于研究与数据归档
Workflow

处理流程

从数据导入、自动处理到人工标注和结构化导出,形成清晰的处理链路。

Step 01

数据导入

音频、视频、文本统一接入。

进入同一处理流程。

Step 02

自动处理

执行转写、分析与预处理。

提升前置处理效率。

Step 03

人工标注

进行标注校对与质量复核。

保证结果一致性。

Step 04

结构化导出

输出标准化结果。

便于训练和系统接入。