huashu-md-html:Markdown和HTML双向转换流水线,4套反AI风格主题

在内容创作和网站开发中,Markdown和HTML之间的转换是常见需求。huashu-md-html是一个一站式转换工具,支持万物转Markdown、Markdown转精美HTML、HTML转Markdown三种能力,并内置了4套反AI风格的主题模板。

项目介绍

huashu-md-html是一个开源的文档转换流水线,集成了多个转换引擎,提供统一的命令行接口。它特别适合需要在不同格式之间频繁转换内容的站长和内容创作者。

项目地址:https://github.com/alchaincyf/huashu-md-html

核心功能

1. 万物转Markdown

支持将多种格式转换为Markdown:

  • PDF文档
  • Word文档(.docx)
  • PowerPoint演示文稿
  • Excel表格
  • HTML网页
  • 图片(OCR识别)
  • 音频/视频(转录)

2. Markdown转HTML

将Markdown转换为精美的HTML页面,支持:

  • 4套内置主题(反AI风格,看起来更自然)
  • 自定义CSS样式
  • 代码高亮
  • 响应式布局

3. HTML转Markdown

将HTML网页转换为干净的Markdown格式,适合:

  • 网页内容归档
  • 博客文章迁移
  • 文档整理

技术架构

huashu-md-html封装了以下工具:

  • markitdown:微软开源的文档转换工具
  • Pandoc:万能文档格式转换器
  • html-to-markdown:HTML到Markdown转换
  • trafilatura:网页内容提取

安装和使用

安装

# 克隆仓库
git clone https://github.com/alchaincyf/huashu-md-html.git
cd huashu-md-html

# 安装依赖
pip install -r requirements.txt

PDF转Markdown

python huashu.py pdf2md input.pdf -o output.md

Markdown转HTML

# 使用默认主题
python huashu.py md2html input.md -o output.html

# 指定主题
python huashu.py md2html input.md -o output.html --theme dark

网页转Markdown

python huashu.py url2md https://example.com/article -o article.md

反AI风格主题

huashu-md-html的一个独特特点是内置了4套”反AI slop”主题。这些主题的设计目标是让生成的HTML页面看起来更自然、更像人工设计的,而不是一眼就能看出是AI生成的模板化页面。

主题特点:

  • 自然的排版和间距
  • 不使用过度装饰的设计元素
  • 适合中文阅读的字体选择
  • 简洁清晰的代码块样式

站长实用场景

  1. 内容批量转换:将大量PDF/Word文档转为网站可用的Markdown
  2. 网页归档:将感兴趣的网页内容保存为Markdown格式
  3. 博客文章制作:用Markdown写文章,一键转为精美HTML
  4. 文档迁移:在不同平台之间迁移内容
  5. API集成:作为内容处理管道的一部分

与Claude Code集成

该项目还提供了Claude Code skill,可以在Claude Code中直接调用转换功能,实现AI辅助的内容处理工作流。

简评

huashu-md-html解决了一个很实际的问题:在不同文档格式之间高效转换。特别是”反AI风格”的主题设计思路很有意思,适合不想让页面看起来太模板化的站长。集成多个转换引擎的做法也很实用,一个工具解决多种转换需求。

来源:GitHub alchaincyf/huashu-md-html

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容