洞悉开源社区的秘密--数据驱动的社区运营的最佳实践

Jun Zhong, Yikun Jiang, Lei Peng

中文演讲 2021-08-06 16:50 GMT+8 (ROOM : B) #bigdata

开源社区正逐渐成为软件生态系统中最关键的路径之一。在开源社区的评估过程中，对社区现状的数据驱动的洞察和分析对于帮助社区健康成长是非常有意义的。因此，数据驱动的操作在社区中起到了关键作用。

在本专题中，我们将介绍我们在数据驱动的社区运营方面的最佳实践。这个运营管理系统帮助中国几个最活跃的开源社区（如openEuler、openGauss、MindSpore等）高效、科学地衡量社区的健康、活跃度和其他关键指标。

本课题包括

为什么我们需要一个数据驱动的运营系统？它介绍了社区面临的运营问题，也介绍了它对开源社区发展的好处。
数据驱动的运营设计概述。介绍了我们在技术选择、指标数据可视化和大数据分析过程中的思考和实践。
结合openEuler社区的真实案例，讲述了数据驱动运营系统是如何实现的，如何利用强大的Apache 大数据项目来构建第一个可用版本（包括数据存储、分析、数据洞察和可视化）。最后，还介绍了我们是如何将我们的改进贡献给Apache上游项目的。

讲师:

Jun Zhong：参与开源社区的工作超过6年。目前，她负责openEuler、MindSpore、openGauss和openLookeng项目的数字运营系统。担任多个社区的核心贡献者，如openEuler开源社区infra sig团队的维护者，openGauss开源社区infra sig团队的维护者，以及OpenStack Manila项目的核心成员。

Yikun Jiang: Yikun Jiang是华为开源开发团队的高级软件工程师，参与开源社区5年多，致力于大数据领域项目的多架构支持和改进。他在云计算和大数据优化方面有五年的经验。之前，他是OpenStack存储项目的核心成员。

Lei Peng: Lei Peng是华为开源开发团队的高级软件工程师，从事MySQL的多架构支持和改进工作。他有五年的SQL开发和大数据使用经验。此前，他研究了MySQL的内核，包括MySQL组复制，并从事分布式数据库的内核开发工作。他有两年的大数据项目使用经验，如Spark/Kafka/Hadoop。