项目简介
huashu-md-html 是一个由花叔(AI Native Coder,独立开发者)开发的多格式转换工具,核心理念是「Markdown 是源代码,HTML/DOCX 是产物」。它提供了四种格式转换能力,覆盖了内容创作者最常见的格式需求。
- 项目地址:https://github.com/alchaincyf/huashu-md-html
- Stars:530+
- 许可证:MIT
- 作者:花叔(代表作:小猫补光灯 App Store 付费榜第一、《一本书玩转 DeepSeek》、nuwa-skill 12k+ GitHub stars)
四大核心能力
1. 万物转 Markdown
支持将 PDF、DOCX、PPTX、XLSX、EPUB、图片、音频、YouTube 视频、网页 URL 等格式转换为干净的 Markdown 文本。底层基于微软的 markitdown 引擎。
python3 scripts/any_to_md.py input.pdf -o output.md
python3 scripts/any_to_md.py https://youtube.com/watch?v=xxx -o video.md
2. Markdown 转精美 HTML
这是该项目的亮点功能。提供4套精心设计的 HTML 主题,反”AI味”设计——没有紫色渐变、没有 emoji 当图标、没有千篇一律的深蓝色背景:
- article:Tufte/Pentagram 排版风格,适合技术文章和长文
- report:白皮书风格,适合报告和分析文档
- reading:Medium 风格极简阅读,适合博客和散文
- interactive:带侧边栏目录和折叠的长文档,适合技术文档
python3 scripts/md_to_html.py article.md --theme article -o article.html
python3 scripts/md_to_html.py article.md --theme reading -o article.html
生成的 HTML 是自包含的——CSS 内嵌,无需外部 CDN 依赖,单文件即可在任何浏览器打开。
3. HTML 转 Markdown
可以将本地 HTML 文件或在线 URL 转换为 Markdown,适合归档已发布的文章。底层使用 html-to-markdown(Rust 引擎)+ trafilatura(智能提取正文,去除导航栏和广告)。
python3 scripts/html_to_md.py article.html -o article.md
python3 scripts/html_to_md.py "https://example.com/blog" -o article.md
4. Markdown 转出版级 DOCX
这个功能对需要向出版社或编辑部提交 Word 文档的作者来说非常实用:
- 自动生成封面页
- 章节目录(TOC)
- 页眉页脚
- 章节自动编号
- 代码块带样式
- 引用块按 emoji 类型着色
- 图片自动嵌入并带说明文字
python3 scripts/md_to_docx.py chapter.md --book --title "书名" --author "作者" -o book.docx
排版设计亮点
该项目的排版设计经过精心打磨,体现了”反 AI 味”的美学追求:
- 中文字体:苹方 / 思源宋体
- 英文字体:Inter / IBM Plex Sans
- 代码字体:JetBrains Mono
- 行高:中文 175%-185%,阅读体验舒适
- 配色克制:不追求”炫酷”,追求”出版社级别”的排版质量
适合谁
- AI 原生写作者:用 Markdown 写作,需要输出 HTML 或 DOCX 的内容创作者
- 博主:需要将已发布的网页文章归档为 Markdown
- 技术文档作者:需要生成带目录的长文档
- 出书作者:需要从 Markdown 章节生成出版级 Word 文档
- 内容搬运者:需要将 PDF/YouTube/网页转换为可编辑的 Markdown
安装和使用
# 作为 Agent Skill 安装(支持 Claude Code、Cursor、Codex、OpenClaw、Hermes)
npx skills add alchaincyf/huashu-md-html
# 或者直接使用脚本
pip install "markitdown[all]" html-to-markdown trafilatura python-docx Pillow
# 需要安装 pandoc(MD→HTML 依赖)
# macOS: brew install pandoc
# Linux: apt install pandoc
简评
huashu-md-html 解决了一个实际痛点:Markdown 写作生态中缺少好用的”产物”输出工具。特别是 Markdown→HTML 的4套主题,打破了”AI 生成的 HTML 都长一个样”的问题。DOCX 输出的出版级质量也很实用,省去了手动调格式的麻烦。
如果你经常需要在 Markdown、HTML、DOCX 之间转换,这个工具值得一试。项目地址:https://github.com/alchaincyf/huashu-md-html
本文参考来源:












GitHub – TauricResearch/TradingAgents




暂无评论内容