项目背景
作为一个新手爸爸,有一天我发现孩子开始沉迷于刷短视频——那些无脑的、快节奏的、毫无营养的内容。看着孩子目不转睛盯着屏幕傻笑,我心里很不是滋味。
直接禁止? 不现实,而且容易引起逆反。
放任不管? 更不可能,这对孩子的注意力和认知发展都有负面影响。
我开始思考:能不能创造一些同样有吸引力,但更有教育价值的内容? 用孩子喜欢的形式,进行良性引导。
与此同时,我也深刻体会到优质早教内容的稀缺性。市面上的绘本、儿歌虽然数量众多,但真正能够个性化匹配孩子年龄、兴趣和发展阶段的内容却寥寥无几。
传统早教内容的痛点:
- 千篇一律:同样的内容给所有孩子,无法因材施教
- 更新缓慢:优质内容制作周期长、成本高
- 互动性差:单向输出,缺乏反馈和调整
于是,Moana 诞生了——一个 AI 原生的早教内容生成平台,为 1-6 岁儿童打造个性化的绘本、儿歌和视频内容,用优质内容替代无脑短视频。
核心功能
AI 绘本生成
这是 Moana 的核心功能。系统可以根据孩子的年龄和教育主题,自动生成完整的绘本故事。
功能特点:
- 30+ 艺术风格:从水彩、油画到日系动漫,满足不同审美偏好
- 100+ 教育话题:涵盖认知发展、情商培养、生活习惯等多个维度
- 9 种主角形象:包括小兔子、小熊、小女孩等,增强代入感
- 智能语音配音:AI 生成自然流畅的朗读音频
图片生成使用 Nana Banana Pro,最新版本的生成效果相当不错,风格丰富且稳定。
AI 儿歌创作
不只是歌词生成,而是完整的原创儿歌,包含旋律、编曲和演唱。
- 支持多种音乐风格(欢快、舒缓、摇篮曲等)
- 基于 Suno 进行 AI 作曲,最新版本的音乐质量已经非常出色
- 歌词内容与教育主题紧密结合
AI 视频生成
将静态绘本转化为动态视频,或者独立创作短视频内容,让孩子的注意力更加集中。
需要说明的是,视频生成的成本目前还是比较高的,这是整个行业面临的挑战,我们也在持续优化和寻找更经济的方案。
孩子档案管理
支持多孩子家庭,每个孩子都有独立的档案:
- 月龄自动计算,智能推荐适龄内容
- 播放历史记录,避免重复推荐
- 学习偏好分析,持续优化推荐算法
丰富的创作模板
为了让家长能够轻松创作出高质量的内容,我们在每一种生成方式中都加入了丰富的创作模板和提示。
绘本创作模板
- 认知启蒙类:颜色认知、形状学习、数字启蒙
- 情感培养类:分享、友谊、勇敢、自信
- 生活习惯类:刷牙、洗手、收拾玩具、按时睡觉
- 安全教育类:交通安全、陌生人、居家安全
- 节日主题类:春节、中秋、生日、圣诞
儿歌创作模板
- 律动儿歌:适合跟着节奏跳舞
- 睡前摇篮曲:轻柔舒缓,助眠安神
- 学习儿歌:字母、数字、古诗词
- 习惯养成歌:吃饭歌、洗澡歌、早安歌
家长只需要选择模板、输入简单的关键词,就能生成独一无二的个性化内容。当然,也支持完全自定义创作,发挥无限想象力。
技术架构
Moana 采用前后端分离的架构,支持 Web 管理后台和微信小程序两个客户端。
后端技术栈
Python 3.11+ / FastAPI / PostgreSQL / SQLAlchemy (异步)
选择 FastAPI 的原因:
- 原生异步支持:AI 服务调用耗时长,异步处理至关重要
- 自动 API 文档:Swagger UI 开箱即用,方便前端对接
- 类型提示友好:配合 Pydantic,数据验证优雅高效
AI 服务集成
| 服务 | 用途 | 选型理由 |
|---|---|---|
| OpenRouter | LLM 路由 | 灵活切换不同模型 |
| Google Gemini | 故事生成 | 长文本生成质量高 |
| Nana Banana Pro | 图片生成 | 最新版本效果出色 |
| Suno | 音乐生成 | AI 作曲质量优秀 |
| MiniMax | 语音合成 | 儿童声线自然 |
前端技术栈
Vue 3 / TypeScript / Tailwind CSS / Vite
管理后台使用 Vue 3 Composition API,配合 Tailwind CSS 快速搭建 UI。
微信小程序
使用 uni-app 开发,一套代码同时支持微信小程序和 H5,降低维护成本。
性能优化实践
项目刚做好的时候,发现加载速度特别慢,用户体验非常差。毕竟我们的内容涉及大量的图片、视频和音频,如果不做优化,等待时间会让家长和孩子都失去耐心。
图片优化
- 格式转换:将 PNG 转为 WebP,体积减少 50%+
- 响应式图片:根据设备分辨率加载不同尺寸
- 懒加载:只加载视口内的图片,滚动时再加载其他
音频优化
- 格式选择:使用 AAC 编码,兼顾质量和体积
- 码率调整:儿歌内容 128kbps 足够,无需更高
- 流式加载:边下载边播放,减少等待时间
视频优化
- 压缩编码:H.264 编码 + 合理码率控制
- 预加载策略:预加载下一个可能播放的内容
- CDN 加速:使用阿里云 OSS + CDN 全球加速
经过这一系列优化,首屏加载时间从 8 秒降到了 2 秒以内,用户体验有了质的提升。
写在最后
做这个项目的初衷很简单:希望能够陪伴孩子一步一步地成长。
每当看到孩子听着 AI 生成的儿歌手舞足蹈,或者认真地看着为 TA 定制的绘本故事,那种满足感是无法用语言形容的。技术的价值,最终要落地到真实的生活场景中。
项目已在 GitHub 开源,欢迎 Star 和贡献:
https://github.com/anon019/Moana
如果你也对 AI + 教育感兴趣,欢迎交流探讨!