huashu-md-html:Markdown 转 HTML/DOCX 的多格式转换工具,4套反AI味主题

项目简介

huashu-md-html 是一个由花叔(AI Native Coder,独立开发者)开发的多格式转换工具,核心理念是「Markdown 是源代码,HTML/DOCX 是产物」。它提供了四种格式转换能力,覆盖了内容创作者最常见的格式需求。

四大核心能力

1. 万物转 Markdown

支持将 PDF、DOCX、PPTX、XLSX、EPUB、图片、音频、YouTube 视频、网页 URL 等格式转换为干净的 Markdown 文本。底层基于微软的 markitdown 引擎。

python3 scripts/any_to_md.py input.pdf -o output.md
python3 scripts/any_to_md.py https://youtube.com/watch?v=xxx -o video.md

2. Markdown 转精美 HTML

这是该项目的亮点功能。提供4套精心设计的 HTML 主题,反”AI味”设计——没有紫色渐变、没有 emoji 当图标、没有千篇一律的深蓝色背景:

  • article:Tufte/Pentagram 排版风格,适合技术文章和长文
  • report:白皮书风格,适合报告和分析文档
  • reading:Medium 风格极简阅读,适合博客和散文
  • interactive:带侧边栏目录和折叠的长文档,适合技术文档
python3 scripts/md_to_html.py article.md --theme article -o article.html
python3 scripts/md_to_html.py article.md --theme reading -o article.html

生成的 HTML 是自包含的——CSS 内嵌,无需外部 CDN 依赖,单文件即可在任何浏览器打开。

3. HTML 转 Markdown

可以将本地 HTML 文件或在线 URL 转换为 Markdown,适合归档已发布的文章。底层使用 html-to-markdown(Rust 引擎)+ trafilatura(智能提取正文,去除导航栏和广告)。

python3 scripts/html_to_md.py article.html -o article.md
python3 scripts/html_to_md.py "https://example.com/blog" -o article.md

4. Markdown 转出版级 DOCX

这个功能对需要向出版社或编辑部提交 Word 文档的作者来说非常实用:

  • 自动生成封面页
  • 章节目录(TOC)
  • 页眉页脚
  • 章节自动编号
  • 代码块带样式
  • 引用块按 emoji 类型着色
  • 图片自动嵌入并带说明文字
python3 scripts/md_to_docx.py chapter.md --book --title "书名" --author "作者" -o book.docx

排版设计亮点

该项目的排版设计经过精心打磨,体现了”反 AI 味”的美学追求:

  • 中文字体:苹方 / 思源宋体
  • 英文字体:Inter / IBM Plex Sans
  • 代码字体:JetBrains Mono
  • 行高:中文 175%-185%,阅读体验舒适
  • 配色克制:不追求”炫酷”,追求”出版社级别”的排版质量

适合谁

  • AI 原生写作者:用 Markdown 写作,需要输出 HTML 或 DOCX 的内容创作者
  • 博主:需要将已发布的网页文章归档为 Markdown
  • 技术文档作者:需要生成带目录的长文档
  • 出书作者:需要从 Markdown 章节生成出版级 Word 文档
  • 内容搬运者:需要将 PDF/YouTube/网页转换为可编辑的 Markdown

安装和使用

# 作为 Agent Skill 安装(支持 Claude Code、Cursor、Codex、OpenClaw、Hermes)
npx skills add alchaincyf/huashu-md-html

# 或者直接使用脚本
pip install "markitdown[all]" html-to-markdown trafilatura python-docx Pillow
# 需要安装 pandoc(MD→HTML 依赖)
# macOS: brew install pandoc
# Linux: apt install pandoc

简评

huashu-md-html 解决了一个实际痛点:Markdown 写作生态中缺少好用的”产物”输出工具。特别是 Markdown→HTML 的4套主题,打破了”AI 生成的 HTML 都长一个样”的问题。DOCX 输出的出版级质量也很实用,省去了手动调格式的麻烦。

如果你经常需要在 Markdown、HTML、DOCX 之间转换,这个工具值得一试。项目地址:https://github.com/alchaincyf/huashu-md-html

本文参考来源:

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容