logo头像
Snippet 博客主题

【内推】字节跳动-AI Lab

部门介绍

我们是谁

字节跳动 AI-Lab 智能语音团队,致力于为公司各个业务提供音频理解、音频合成、对话交互、音乐检索和智能教学AI技术能力与解决方案。自2017年成立以来,我们专注于研发行业领先的AI智能语音技术,不断探索AI与业务场景的结合,以产生更大的用户及客户价值。

我们在做什么

为明星级产品提供支持
我们为今日头条、抖音、西瓜视频、番茄小说、飞书办公套件、大力智能教育台灯、瓜瓜龙启蒙等字节跳动旗下的明星级产品提供了各类AI解决方案。覆盖图文资讯、视频、教育、办公、有声内容、智能硬件等八个重要业务场景,截至目前,已服务了上百个业务合作伙伴。

多语言覆盖,助力业务飞速发展
伴随字节跳动业务的飞速发展,我们的语音识别和语音合成覆盖了多种语言和方言。未来,我们希望发展70+语言和20+方言,用于满足内容创作与交流平台的需求。

我们的成果

团队每天支持十亿级音频请求,处理千万小时规模音频。在此过程中,我们沉淀了5大算法方向和5大工程框架,已有7篇论文入选 ICASSP 2021。

5大算法方向
音频理解:语音增强、事件检测、声纹/语种/语音识别
内容创作:语音合成、音色转换、歌唱合成
音乐检索:听歌识曲、翻唱识别、哼唱识别
多模交互:流式处理、双工对话、虚拟数字人
智能教学:评测诊断、纠正反馈、自适应学习

5大工程框架
服务体系架构 、算法推理引擎 、模型训练平台 、数据流程平台、评测反馈平台

7篇论文入选 ICASSP 2021

  1. Rule-embedded network for audio-visual voice activity detection in live musical video streams, Yuanbo Hou, Yi Deng, Bilei Zhu, Zejun Ma, Dick Botteldooren, ICASSP 2021.
  2. A HRNET-BLSTM MODEL WITH TWO-STAGE TRAINING FOR SINGING MELODY EXTRACTION, Yongwei Gao, Xingjian Du, Bilei Zhu, Xiaoheng Sun, Wei Li, Zejun Ma, ICASSP 2021.
  3. BYTECOVER: COVER SONG IDENTIFICATION VIA MULTI-LOSS TRAINING, Xingjian Du, Zhesong Yu, Bilei Zhu, Xiaoou Chen, Zejun Ma, ICASSP 2021.
  4. SINGING MELODY EXTRACTION FROM POLYPHONIC MUSIC BASED ON SPECTRAL CORRELATION MODELING, Xingjian Du, Bilei Zhu, Qiuqiang Kong, Zejun MA, ICASSP 2021.
  5. PPG-BASED SINGING VOICE CONVERSION WITH ADVERSARIAL REPRESENTATION LEARNING, Zhonghao Li, Benlai Tang, Xiang Yin, Yuan Wan, Ling Xu, Chen Shen, Zejun Ma, ICASSP 2021.
  6. A CHAPTER-WISE UNDERSTANDING SYSTEM FOR TEXT-TO-SPEECH IN CHINESE NOVELS, Junjie Pan, Lin Wu, Xiang Yin, Pengfei Wu, Chenchang Xu, Zejun Ma, ICASSP 2021.
  7. IMPROVING RNN TRANSDUCER MODELING FOR SMALL-FOOTPRINT KEYWORD SPOTTING, Yao Tian, Haitao Yao, Meng Cai, Yaming Liu, Zejun Ma, ICASSP 2021.

我们能提供什么

加入工程团队,从容应对挑战!
应对超大并发实时流量,构建具备强大吞吐和水平扩展能力的系统架构;维护超大规模计算节点,推进云边端芯立体解决方案;支撑多个算法方向大规模分布式高效模型训练迭代。

加入算法团队,创享AI未来!
接受来自八大业务场景中的真实算法挑战,基于字节跳动内容平台的海量数据和充足的算力资源,在端到端一体化建模、多语言及低资源建模、多模态联合建模、大规模无监督预训练等核心算法领域不断深入,进行原创性的前沿算法研究,见证它们在实际业务中落地。

加入产品团队,搭建产品与AI技术的桥梁!
与字节跳动全系产品深度合作,服务来自不同语言和文化的用户;运用AI算法解决复杂问题,形成解决方案;参与全新产品线孵化过程,见证下一个明星产品的诞生。

加入专家团队,感受知识的力量!
面对丰富的语言相关产品需求,结合语言学知识、音乐知识,联合多语言、方言、手语专家,基于算法理解,建立数据采集和标注标准,以数据为依托去优化产品效果。

热门岗位

AI-Lab 语音研发工程师 — 服务架构方向
深圳·社招·正式

职位描述
1、设计构建前沿的智能语音、对话系统架构,支持超大并发毫秒级延迟的极致人机交互体验;
2、构建超大规模神经网络异构在线集群,承接每秒万亿级实时运算任务;
3、将基于前沿深度学习的语音和对话技术框架落地应用到实际业务中;
4、为字节跳动全系产品提供 AI 语音、对话技术服务,用 AI 技术影响数亿国内国际用户。

职位要求
1、拥有计算机及相关专业本科以上学历,两年以上 C++/Go/Python 项目开发经验;
2、精通数据结构和算法设计,熟悉系统性能调优的方式,熟悉 Linux 开发环境;
3、具备分布式在线系统相关项目经验者优先;
4、在 ACM/NOI/IOI/TopCoder 获奖者优先。

内推链接:https://job.toutiao.com/s/Joqora7

AI-Lab机器学习算法引擎研发工程师 —语音方向
深圳·社招·正式

职位描述
1、设计和研发业界领先的高性能端云算法引擎,提供满足语音识别,对话交互,语音合成,音频检索等场景的核心原子能力;
2、负责深度优化核心引擎,包括端云一体的高性能计算引擎,音频特征处理引擎,大规模解码引擎,音频合成引擎,音频特效引擎,对话交互引擎,音频检索引擎等常用引擎极致优化;
3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力;
4、负责为字节跳动全系产品(今日头条、抖音、抖音火山版、西瓜视频,飞书,番茄小说,瓜瓜龙等)提供 AI 语音理解、对话以及语音合成等方面的能力,用 AI 技术影响国内国际用户。

职位要求
1、扎实的C++或C编程语言,熟悉常用数据结构以及基础算法,对有挑战的工作富有热情;
2、熟悉计算机体系结构和操作系统,具备大型软件/库架构的设计与研发经验的更佳;
3、有很强的分析问题和解决问题的能力,有强烈的责任心;

加分项

  • 在 ACM/NOI/IOI/TopCoder 获奖者优先;
  • 有定点量化、指令集优化、深度模型优化等相关项目经验者优先;
  • 有CPU,GPU,NPU,ARM,OpenCL,DSP等高性能计算优化经验者优先;
  • 有相关语音信号处理,语音识别、语音合成或者自然语言处理经验的优先;
  • 有相关语音算法引擎开发经验的优先。

内推链接:https://job.toutiao.com/s/Job6fYx

AI-Lab 语音研发工程师 — 数据平台方向
北京·社招·正式

职位描述
1、设计构建智能语音、对话数据体系,打造一体化多媒体数据存储、索引、处理能力;
2、打造 PB 级数据处理引擎,应对日均 TB 级数据增长;
3、为字节跳动全系产品(今日头条、抖音、抖音火山版、西瓜视频等)提供 AI 数据处理及索引技术,用数据技术影响数亿国内国际用户。

职位要求
1、拥有计算机及相关专业本科以上学历,两年以上Python/ Java / Scala 项目开发经验;
2、精通数据结构和算法设计,熟悉系统性能调优的方式,熟悉 Linux 开发环境;
3、熟悉 Spark/Storm/Hive 等大数据工具,熟知 MySQL/ Flink/MongoDB 等常用数据库;
4、有大数据相关项目经验者优先;
5、在 ACM/NOI/IOI/TopCoder 获奖者优先。

内推链接:https://job.toutiao.com/s/JobBB6Y

前端开发工程师(React)
北京·社招·正式

职位描述
1、负责 AI Lab 相关平台的前端开发与功能迭代工作;
2、负责公司业务线 AI 支持平台的前端搭建和维护工作;
3、协助算法工程师设计开发标注训练平台工具。

职位要求
1、1-3 年或以上前端开发经验;
2、了解计算机网络原理,HTTP 协议,基本的浏览器渲染和网络传输过程;
3、熟练使用 React 技术栈或至少一类前端框架(Angular/Vue.js 等)且具备快速转向 React 的能力;
4、熟练掌握HTML5和CSS3基本知识,掌握Less;
5、熟练掌握Typescript和ES6/ES2017/ES2018, 同时有一定的ES5的经验, 掌握jQuery;
6、熟悉Webpack和相关配置,包括但不限于各种loader,rules配置等, 开发过程中严格遵循前端工程化,模块化,组件化;
7、熟悉 Node.js,有相关开发经验;
【加分项】
1、有可视化、工程化等前端领域工作经验者优先;
2、系统研究过 Ant Design Pro 项目并掌握相关技术栈优先;
3、熟悉 SSG/SSR 及相关技术者优先。

内推链接:https://job.toutiao.com/s/Job2ahu

AI-Lab 语音研发工程师 — 客户端方向
北京·社招·正式

职位描述
1、设计构建智能语音、对话移动端 SDK;
2、负责 SDK 整体架构设计,打造极致低延迟体验,同时满足通用需求与多平台兼容性;
3、为字节跳动全系产品(今日头条、抖音、抖音火山版、西瓜视频等)提供 AI 语音、对话 SDK,用 AI 技术影响数亿国内国际用户。

职位要求
1、拥有计算机及相关专业本科以上学历,两年以上移动端 C++/iOS/Android 项目开发经验;
2、精通数据结构和算法设计,熟悉系统性能调优的方式,熟悉移动端开发环境;
3、熟悉Android系统音频框架开发,有项目经验者优先;
4、有语音、对话 SDK 相关项目经验者优先。

内推链接:https://job.toutiao.com/s/JobS2hD

更多岗位:https://job.toutiao.com/s/Job2oHX