项目作品

Moana:用 AI 重新定义早教内容生成

9 min read
AI / 早教 / 多模态 / FastAPI / Vue / 微信小程序 / 开源项目

项目背景

作为一个新手爸爸,有一天我发现孩子开始沉迷于刷短视频——那些无脑的、快节奏的、毫无营养的内容。看着孩子目不转睛盯着屏幕傻笑,我心里很不是滋味。

直接禁止? 不现实,而且容易引起逆反。

放任不管? 更不可能,这对孩子的注意力和认知发展都有负面影响。

我开始思考:能不能创造一些同样有吸引力,但更有教育价值的内容? 用孩子喜欢的形式,进行良性引导。

与此同时,我也深刻体会到优质早教内容的稀缺性。市面上的绘本、儿歌虽然数量众多,但真正能够个性化匹配孩子年龄、兴趣和发展阶段的内容却寥寥无几。

传统早教内容的痛点:

  • 千篇一律:同样的内容给所有孩子,无法因材施教
  • 更新缓慢:优质内容制作周期长、成本高
  • 互动性差:单向输出,缺乏反馈和调整

于是,Moana 诞生了——一个 AI 原生的早教内容生成平台,为 1-6 岁儿童打造个性化的绘本、儿歌和视频内容,用优质内容替代无脑短视频


核心功能

AI 绘本生成

这是 Moana 的核心功能。系统可以根据孩子的年龄和教育主题,自动生成完整的绘本故事。

功能特点

  • 30+ 艺术风格:从水彩、油画到日系动漫,满足不同审美偏好
  • 100+ 教育话题:涵盖认知发展、情商培养、生活习惯等多个维度
  • 9 种主角形象:包括小兔子、小熊、小女孩等,增强代入感
  • 智能语音配音:AI 生成自然流畅的朗读音频

图片生成使用 Nana Banana Pro,最新版本的生成效果相当不错,风格丰富且稳定。

AI 儿歌创作

不只是歌词生成,而是完整的原创儿歌,包含旋律、编曲和演唱。

  • 支持多种音乐风格(欢快、舒缓、摇篮曲等)
  • 基于 Suno 进行 AI 作曲,最新版本的音乐质量已经非常出色
  • 歌词内容与教育主题紧密结合

AI 视频生成

将静态绘本转化为动态视频,或者独立创作短视频内容,让孩子的注意力更加集中。

需要说明的是,视频生成的成本目前还是比较高的,这是整个行业面临的挑战,我们也在持续优化和寻找更经济的方案。

孩子档案管理

支持多孩子家庭,每个孩子都有独立的档案:

  • 月龄自动计算,智能推荐适龄内容
  • 播放历史记录,避免重复推荐
  • 学习偏好分析,持续优化推荐算法

丰富的创作模板

为了让家长能够轻松创作出高质量的内容,我们在每一种生成方式中都加入了丰富的创作模板和提示

绘本创作模板

  • 认知启蒙类:颜色认知、形状学习、数字启蒙
  • 情感培养类:分享、友谊、勇敢、自信
  • 生活习惯类:刷牙、洗手、收拾玩具、按时睡觉
  • 安全教育类:交通安全、陌生人、居家安全
  • 节日主题类:春节、中秋、生日、圣诞

儿歌创作模板

  • 律动儿歌:适合跟着节奏跳舞
  • 睡前摇篮曲:轻柔舒缓,助眠安神
  • 学习儿歌:字母、数字、古诗词
  • 习惯养成歌:吃饭歌、洗澡歌、早安歌

家长只需要选择模板、输入简单的关键词,就能生成独一无二的个性化内容。当然,也支持完全自定义创作,发挥无限想象力。


技术架构

Moana 采用前后端分离的架构,支持 Web 管理后台和微信小程序两个客户端。

后端技术栈

Python 3.11+ / FastAPI / PostgreSQL / SQLAlchemy (异步)

选择 FastAPI 的原因:

  1. 原生异步支持:AI 服务调用耗时长,异步处理至关重要
  2. 自动 API 文档:Swagger UI 开箱即用,方便前端对接
  3. 类型提示友好:配合 Pydantic,数据验证优雅高效

AI 服务集成

服务用途选型理由
OpenRouterLLM 路由灵活切换不同模型
Google Gemini故事生成长文本生成质量高
Nana Banana Pro图片生成最新版本效果出色
Suno音乐生成AI 作曲质量优秀
MiniMax语音合成儿童声线自然

前端技术栈

Vue 3 / TypeScript / Tailwind CSS / Vite

管理后台使用 Vue 3 Composition API,配合 Tailwind CSS 快速搭建 UI。

微信小程序

使用 uni-app 开发,一套代码同时支持微信小程序和 H5,降低维护成本。


性能优化实践

项目刚做好的时候,发现加载速度特别慢,用户体验非常差。毕竟我们的内容涉及大量的图片、视频和音频,如果不做优化,等待时间会让家长和孩子都失去耐心。

图片优化

  • 格式转换:将 PNG 转为 WebP,体积减少 50%+
  • 响应式图片:根据设备分辨率加载不同尺寸
  • 懒加载:只加载视口内的图片,滚动时再加载其他

音频优化

  • 格式选择:使用 AAC 编码,兼顾质量和体积
  • 码率调整:儿歌内容 128kbps 足够,无需更高
  • 流式加载:边下载边播放,减少等待时间

视频优化

  • 压缩编码:H.264 编码 + 合理码率控制
  • 预加载策略:预加载下一个可能播放的内容
  • CDN 加速:使用阿里云 OSS + CDN 全球加速

经过这一系列优化,首屏加载时间从 8 秒降到了 2 秒以内,用户体验有了质的提升。


写在最后

做这个项目的初衷很简单:希望能够陪伴孩子一步一步地成长

每当看到孩子听着 AI 生成的儿歌手舞足蹈,或者认真地看着为 TA 定制的绘本故事,那种满足感是无法用语言形容的。技术的价值,最终要落地到真实的生活场景中。

项目已在 GitHub 开源,欢迎 Star 和贡献:

https://github.com/anon019/Moana

如果你也对 AI + 教育感兴趣,欢迎交流探讨!