ebook2audiobook,一款 2024 年开源的工具,利用先进的文本到语音 (Text-to-Speech, TTS) 技术,将电子书中的文本内容自动转换为语音,生成可供用户收听的有声书。
支持多种电子书格式,如 EPUB、PDF、MOBI 等,并能够保留章节结构和元数据,使生成的有声书更加易于导航和理解。同时支持1107+ 语言、TTS 引擎切换、语音克隆等高阶功能,最低 4 GB 内存即可运行,支持 Windows、macOS、Linux

⚡ 核心功能亮点
智能格式转换
支持 EPUB、PDF、MOBI、TXT 等常见电子书格式,输出高质量的 .m4b/.mp3 音频文件。
完整章节结构
自动识别原书章节并生成对应音频片段,保持原有目录结构,方便跳转收听。
多引擎语音合成
集成 XTTSv2、Bark、Fairseq 等多个 TTS 引擎,可根据语言和场景选择最佳合成方案。
强大语言支持
覆盖 1107 种语言,包括中文、阿拉伯语、日语、韩语等复杂语言体系。
个性化语音克隆
输入个人音频样本即可克隆专属声音,让生成的有声书更具个人特色。
轻量级部署
最低仅需 4GB 内存即可运行,支持 Docker 一键部署,提供友好的 Web 操作界面。
使用方法
Web GUI 使用方法
git clone https://github.com/DrewThomasson/ebook2audiobook
cd ebook2audiobook
pip install -r requirements.txt
python app.py
# 浏览器打开提示的地址,上传 ebook,选择语言 + 模型,点击 "Convert"
二、命令行(无界面运行)
python app.py \
--headless \
--ebook path/to/book.epub \
--language zh-cn \
--tts_engine XTTSv2 \
--output_format m4b
三、Docker 部署
docker run -it --rm -p 7861:7861 drewthomasson/ebook2audiobook:latest
# 打开浏览器访问 http://localhost:7861



