AI教育行业领导者的云存储实践

发布时间:2025-03-19 19:00:10 行业类型:金融云案例 关键词:
122741

流利说是世界领先的人工智能驱动型教育公司,以英语学习为核心,采用AI技术提供个性化的语言学习解决方案。随着用户规模突破亿级,其传统IDC架构面临严重挑战,公司决定借助阿里云OSS对象存储等服务,构建灵活高效的数据湖架构,保障业务高峰期稳定运行,同时优化IT运营成本。

所属行业

AI教育科技

项目类型

大数据上云

项目地点

中国大陆

项目背景

流利说是中国领先的AI教育科技公司,自主研发了领先的英语口语评测、写作打分引擎和深度自适应学习系统,从听、说、读、写多个维度提升用户的英语水平。截至2020年中期,流利说已累计注册用户1.856亿,拥有巨大的"中国人英语语音数据库",积累了约37亿分钟的对话和504亿句录音。

2013年流利说推出首款产品"英语流利说",集成语音识别、打分和自适应学习等多种核心技术,凭借AI英语老师和游戏化学习体验迅速获得市场认可。然而,随着用户数量从百万级扩张至亿级规模,传统IDC架构已难以支撑业务高速增长,特别是在面对高低峰期数据流量变化、功能日益丰富的产品组合,以及日益复杂的数据分析需求时,IT架构面临前所未有的挑战。

为了解决这些问题,流利说需要一个更具弹性、更高效、更安全的云计算解决方案,以支持其业务持续创新和扩展。

痛点难题

流量波动巨大

不同时段流量变化大,高峰时段的流量会达到平时的10倍,传统架构难以应对这种动态变化,系统弹性能力面临严峻考验。

IT成本居高不下

传统IDC架构下,为应对业务高峰期需常驻大量计算资源,导致资源利用率低下,IT运维成本占比过高,严重影响业务盈利能力。

数据规模与复杂度激增

随着用户数量破亿,每日需要处理和分析的数据量激增,同时需为每个用户提供个性化学习建议,对数据处理能力和系统性能提出极高要求。

解决方案

01

OSS对象存储作为数据基础层

选用阿里云OSS作为数据基础层,解决流利说多类数据的统一存储需求,同时支持对接多种计算引擎。OSS提供了99.9999999999%(12个9)的数据持久性和99.995%的高可用性,为流利说核心业务提供坚实保障。

02

EMR大数据计算集群

通过阿里云EMR构建大数据计算集群,提供包括Hadoop、Hive、Spark、Presto在内的多种大数据计算引擎。基于数据湖的存储与计算解耦架构,所有计算任务的最终数据均存储到OSS持久存储,确保数据安全性和一致性。

03

弹性计算资源配置

结合阿里云ECS弹性实例和K8S容器服务,根据实际业务需求动态扩展或缩减计算资源,无须按照业务峰值常驻资源。在业务低谷期适当减少资源配置节约成本,而在高峰期则迅速扩容以保障用户体验,实现资源利用的最大化。

04

多层次安全防护

通过阿里云VPC网络、RAM访问控制等保障体系,为流利说的核心资产"中国人英语语音数据库"提供更可控、更细粒度的安全访问控制保护,确保海量用户数据安全可靠。

项目成果

系统性能大幅提升

业务高峰期系统响应速度提升40%以上,即使在用户访问量达到峰值时也能保持稳定运行,有效避免了系统宕机风险。

运营成本显著降低

通过弹性资源配置,IT运维成本降低约35%,资源利用率大幅提升,硬件投入减少,整体IT支出比例显著下降。

数据价值充分释放

成功构建数据规模达上千亿的"中国人英语语音数据库",为AI算法训练提供海量数据支撑,显著提升了语音识别和评测精度。

业务扩展能力增强

云架构支持业务规模扩展200%以上,新功能上线速度提升60%,市场响应能力大幅增强,为产品持续创新奠定基础。

在线咨询