在内容创作和网站开发中,Markdown和HTML之间的转换是常见需求。huashu-md-html是一个一站式转换工具,支持万物转Markdown、Markdown转精美HTML、HTML转Markdown三种能力,并内置了4套反AI风格的主题模板。
项目介绍
huashu-md-html是一个开源的文档转换流水线,集成了多个转换引擎,提供统一的命令行接口。它特别适合需要在不同格式之间频繁转换内容的站长和内容创作者。
项目地址:https://github.com/alchaincyf/huashu-md-html
核心功能
1. 万物转Markdown
支持将多种格式转换为Markdown:
- PDF文档
- Word文档(.docx)
- PowerPoint演示文稿
- Excel表格
- HTML网页
- 图片(OCR识别)
- 音频/视频(转录)
2. Markdown转HTML
将Markdown转换为精美的HTML页面,支持:
- 4套内置主题(反AI风格,看起来更自然)
- 自定义CSS样式
- 代码高亮
- 响应式布局
3. HTML转Markdown
将HTML网页转换为干净的Markdown格式,适合:
- 网页内容归档
- 博客文章迁移
- 文档整理
技术架构
huashu-md-html封装了以下工具:
- markitdown:微软开源的文档转换工具
- Pandoc:万能文档格式转换器
- html-to-markdown:HTML到Markdown转换
- trafilatura:网页内容提取
安装和使用
安装
# 克隆仓库
git clone https://github.com/alchaincyf/huashu-md-html.git
cd huashu-md-html
# 安装依赖
pip install -r requirements.txt
PDF转Markdown
python huashu.py pdf2md input.pdf -o output.md
Markdown转HTML
# 使用默认主题
python huashu.py md2html input.md -o output.html
# 指定主题
python huashu.py md2html input.md -o output.html --theme dark
网页转Markdown
python huashu.py url2md https://example.com/article -o article.md
反AI风格主题
huashu-md-html的一个独特特点是内置了4套”反AI slop”主题。这些主题的设计目标是让生成的HTML页面看起来更自然、更像人工设计的,而不是一眼就能看出是AI生成的模板化页面。
主题特点:
- 自然的排版和间距
- 不使用过度装饰的设计元素
- 适合中文阅读的字体选择
- 简洁清晰的代码块样式
站长实用场景
- 内容批量转换:将大量PDF/Word文档转为网站可用的Markdown
- 网页归档:将感兴趣的网页内容保存为Markdown格式
- 博客文章制作:用Markdown写文章,一键转为精美HTML
- 文档迁移:在不同平台之间迁移内容
- API集成:作为内容处理管道的一部分
与Claude Code集成
该项目还提供了Claude Code skill,可以在Claude Code中直接调用转换功能,实现AI辅助的内容处理工作流。
简评
huashu-md-html解决了一个很实际的问题:在不同文档格式之间高效转换。特别是”反AI风格”的主题设计思路很有意思,适合不想让页面看起来太模板化的站长。集成多个转换引擎的做法也很实用,一个工具解决多种转换需求。
来源:GitHub alchaincyf/huashu-md-html
© 版权声明
THE END
















暂无评论内容