1. 公司平台工程架构概述
1.1 公司简介
庚商公司,作为一家服务高校的信息技术公司,致力于通过创新技术和解决方案推动教育业务的支撑和数字化转型。公司的核心技术业务包括云地SAAS平台服务、产品开发及组合服务、物联及系统集成、数据分析及治理、人工智能以及云计算等领域。我们的使命是通过先进的技术和卓越的服务,帮助客户提升业务效率,实现数字化转型。
2. 主要技术发展
2.1 平台工程
2.1.1 庚商平台工程
庚商平台工程(gvsun Platform Engineering)旨在通过构建一套统一的基础设施和工具集,为开发团队提供一个高效、可靠的开发环境。它的目标是简化开发、测试、部署和运营的各个环节,促进持续交付和DevOps实践的实现。
庚商构建了基于云原生的云地多租户SAAS平台,并将平台生产运营化,统管DevOps一体化运行,在主生产线上,通过pipeline实现数据流转和统一运营。目前非商业数据库1184个,商业数据库641个;
目前经过二十年发展,基于业务和领域的数字化转型已经构建,全方位支持高校及普教用户。
平台构建9维技术架构【三网三平台三中心】打造庚商数字基座,通过鲁班楼用户前台、教师楼管理中台、庚商楼开源开放协同后台,针对互联网、物联网、内网接入要求,按照应用中心、数据中心、建制中心场景驱动的安全和服务要求,构建平台、网络、应用相分离的三网三中心三平台嵌合技术架构,融合大数据、人工智能、物联网信息技术手段,构建数字化转型技术基座。
三网是九大模块中基础设施的建设,主要是根据内外环境和安全要素进行的网络切分,
外网是对外开放的应用和庚商的云端系统;主要是以云架构持续运维和rancher等工具的云原生技术为主。
内网是指内部使用的业务以及供业务使用所提供的网络通信、计算与存储资源。
物联网是指为了支撑业务系统使用而铺设的物联设备网络,物联设备包括门禁、摄像头、班牌、考勤机、大型仪器、虚拟化等,外网的应用中心和内网的中台及后台系统都可以有条件的访问物联中的服务以及设备。
三平台是根据使用对象进行划分的,鲁班楼前台是师生应用,包括相关的通知公告、业务链接以及操作手册;其实九大模块的对外展示部分。
三中心主要是为三网、三平台提供资源、服务和应用支撑的。
平台通过业务领域的标准定义描述业务模型,首先确定业务标准及业界标准,进行规范定义及合规定义,然后构建业务模型-业务交通图,再将业务标准转换为建制标准,进行业务规格定义,最后将建制规格定义归结到数据资源,并实现平台从业务治理具体到数据治理。
GLAB数字化治理历经十五年,最新整合GAI,通过构建基于云原生的云地多租户SAAS平台,并将平台生产运营化,统管DevOps一体化运行,在主生产线上,通过pipeline实现数据流转和统一运营。
2.1.2 整体平台化支持(TES)
工程化组成 | 工程化内容 |
---|---|
网络平台(NP) | 平台将提供全面的网络服务和接入能力。 1. 互联网接入:平台将提供互联网的接入服务,这可能包括对外的网络连接和数据交换。 2. 物联网接入:考虑到平台的全面性,可能也包括物联网设备的接入和管理。 3. 内网接入:平台将支持内网接入,这可能涉及到教育机构内部的网络连接,确保内部数据的安全和高效传输。 |
用户平台(UP) | 1. 师生用户:平台将服务于教师和学生,提供他们所需的教育和学习工具。 2. 企业用户:企业用户可能指的是与教育机构合作的企业,平台将提供相应的服务以支持这种合作。 3. 中台管理与服务用户:中台管理可能涉及到教育机构的行政管理和服务,平台将提供相应的管理工具和服务。 4. 决策与治理用户:决策与治理用户可能指的是学校的管理层,平台将支持他们进行教育决策和治理工作。 |
应用平台(AP) | 1. 教育应用中心:平台将包含一个教育应用中心,这可能是一个集中的地方,提供各种教育软件和工具。 2. 学院资源与计算中心:这可能指的是平台提供的资源管理和计算服务,支持学院的资源分配和计算需求。 3. 教育合规与建制中心:平台将支持教育机构的合规性和制度建设,帮助学校遵守相关法规和标准。 |
2.1.3 平台应用池构成(PAC)
应用池构成 | 应用池内容 |
---|---|
教育管理类应用(MA) | - 这类应用主要针对教育机构的管理层,如学院的行政管理人员,用于支持教育管理和决策服务。 - 它们可能包括学生信息管理、课程安排、成绩跟踪、教育资源分配等功能。 - 教育管理类应用:应用的目的在于提高教育机构的管理效率和决策质量。 |
学习教学类应用(TA) | - 这类应用专注于支持教师的教学活动和学生的学习过程。 - 它们可能涵盖电子教学材料、在线作业系统、互动式学习工具、在线考试和评估系统等。 - 学习教学类应用的目标是增强教学互动性,提升学习体验,并促进个性化学习。 |
学科治理类应用(SA) | - 学科治理类应用可能是指针对特定学科领域的管理工具,它们帮助教育机构对特定学科的教学内容和质量进行监控和管理。 - 这些应用可能包括课程内容管理、教学方法研究、学科资源库和教师专业发展支持等。 - 学科治理类应用旨在确保教学内容的质量和更新,以及支持教师的专业成长。 |
2.1.4 标准库构成(SDL)
标准库提供标准内容池的结构化标准定义,通过统一建制管理方式,以数据网状结构定位方式进行构建、定义及引用,通过建制中心进行标准管理。
2.1.5 平台内容池构成(PCC)
内容池名称 | 内容池说明 |
---|---|
标准教育评估池(EL) | 平台将提供一个标准化的教育评估池,这可能包括各种教育评估工具和方法,用于帮助教育机构进行学生学习成效的评估和分析。 |
标准实验项目库(PL) | 将包含一系列标准化的实验项目,这些项目可能覆盖不同的学科和课程要求,供教师和学生在教学或学习过程中使用。 |
标准报表报告库(RL) | 平台将提供标准化的报表和报告模板,帮助教育机构生成和定制各种教育相关的报表和报告,如学生成绩、教学进度等。 |
标准教育管理库(ML) | 包含标准化的教育管理工具和流程,可能用于学校或学院的行政管理、课程管理、学生事务管理等方面。 |
标准教育装备条件库(EQL) | 可能涉及教育所需的各种硬件和软件资源的条件库,包括教室设备、实验室器材、教学软件等,以支持教育活动的顺利进行。 |
标准知识库(KL) | 构建一个集中的知识库,包含教育领域的各类知识点、教学资源和学术资料,供教师和学生访问和使用。 |
注: 这些服务的提供旨在帮助教育机构提高教学和管理效率,同时降低重复建设和资源浪费。通过标准化的资源库,教育机构可以更加便捷地获取所需的教育内容和服务,从而提升教育质量和学生的学习体验。
2.2 平台服务与营运构成(OPS)
服务项目 | 服务内容 |
---|---|
服务平台的构建与维护(SPMS) | 涉及建立一个基于私密教育数据集的运营与服务平台,这个平台将利用人工智能技术提供教育管理和教学支持服务。 |
软件与硬件的整合(SIHS) | 服务包括将教育软件与服务器硬件(如CPU、内存、存储空间和显卡)整合,提供整体解决方案,而非单独销售软件。 |
远程服务(RS) | 提供7天24小时的值班服务,确保VPN数据上线、数据去隐私处理、报告报表支持、人工智能工具接入等。 |
人工智能服务(IRS) | 专注于提供人工智能服务,包括教育智能企业服务,以及将私域库拆分后的知识库服务,允许学生进行问答 |
教育内容与应用池支持(ECS) | 提供标准化的教育评估、项目库、实验报告库和教育管理库,以及基于高校的核心价值,进行内容服务和支持。 |
技术架构与网络服务(TNS) | 包括互联网和内网的技术架构,确保所有服务和应用都能通过网络接口接入。 |
定制化服务(CS) | 根据教育机构的具体需求,提供定制化的服务,如教育管理类应用、学习教学类应用和学科治理类应用。 |
参考数据面板:ITLE服务台
2.3 开发与持续交付(CMMI)
开发与持续交付管理基于两个标准及生态体系进行治理,包括CMMI DEV和DEVOPS持续改进。目前大多数标准都融合了devops的原则,在庚商治理体系中以CMMI DEV构建开发与持续交付管理的治理体系,同时扩展devops的主要成果进行实践。
参考链接:1.庚商CMMI DEV实践 2.CMMI DEV数据治理面板 3.开发管理面板 4.开发人员管理面板
2.4 数据治理(DMBOK2)
庚商数字化治理历经十五年,平台化治理历经5年。
DAMA DMBOK(Data Management Body of Knowledge)是数据管理领域的权威指南,由数据管理国际协会(Data Management International)制定。DMBOK专注于定义和规范数据管理的最佳实践。它涵盖了广泛的主题,包括数据治理、数据架构、数据建模和设计、数据存储和操作以及数据安全等等,以协助其有效地管理和利用数据资源。,庚商公司在数据治理实践中基于DMBOK进行数据治理实践。
庚商构建教育数据平台,确定完善并改进了数字化组织,通过生产委员会协调管理生产运营体系;通过产品委员会协调;通过产品与集成委员会协调管理产品及优化以及客户应用支持;通过开发委员会协调管理平台及产品的开发。同时通过经营办对公司的风险,预警及管理考核进行节点控制和管理;通过总工办进行技术管理,监管技术的方向及执行判断以及技术风险控制。
以上所有职能的落实最小单位是4人教研组,通过教研组实现庚商数字化平台的一体化DEVOPS,构成闭环流水线保证整体平台持续运营,更好的服务客户。
参考资料:IT治理DBBOK2应用
3. 人工智能
3.1 资源及RAG智能体
3.2 应用方向:
(1)RAG
检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在 LLM 本就强大的功能基础上,RAG 将其扩展为能访问特定领域或组织的内部知识库,所有这些都无需重新训练模型。这是一种经济高效地改进 LLM 输出的方法,让它在各种情境下都能保持相关性、准确性和实用性。
举例:
个人/私域知识、文档内容检索。
报告、论文内容总结。
(2)Agent 智能体
人工智能代理(Artificial Intelligence Agent)是一种能够感知环境进行自主理解,进行决策和执行动作的智能体。AI Agent具备通过独立思考、调用工具逐步完成给定目标的能力。不同于大模型的区别在于,大模型与人类的交互通过提示词(Prompt)实现,用户的提示词是否清晰明确会影响大模型的效果。而AI Agent 仅需要给定一个,就能够实现针对目标进行独立思考并完成目标任务。
大模型在进行训练的庞大数据中包含了各种数据以及大量的人类行为数据,让大模型具备了模拟人类的交互以及随着模型的不断增大,大模型涌现出了上下文学习能力、思维链、推理能力等类似人类思考方式的能力。而大模型同时也存在很多的问题,如幻觉、上下文限制等问题。因此将大模型作为 AI Agent 的核心大脑,实现将复杂任务拆解成可以实现的子任务等能力,构成具备自主思考决策和执行任务的智能体。
举例:
通过调用外部接口实现实验室查询、预约。
3.3 架构组成:
-
LLM应用池(LAP)
Dify:Dify 是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。
Xinference:Xorbits Inference(Xinference):是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。 -
具体实践
LLM应用池 | 概述 | 核心功能 |
---|---|---|
Dify | Dify 是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产 | 1. 工作流: 在画布上构建和测试功能强大的 AI 工作流程。 2. 全面的模型支持: 与数百种专有/开源 LLMs 以及数十种推理提供商和自托管解决方案无缝集成,涵盖 GPT、Mistral、Llama3 以及任何与 OpenAI API 兼容的模型。完整的支持模型提供商列表可在此处找到。 3. Prompt IDE: 用于制作提示、比较模型性能以及向基于聊天的应用程序添加其他功能(如文本转语音)的直观界面。 4. RAG Pipeline: 广泛的 RAG 功能,涵盖从文档摄入到检索的所有内容,支持从 PDF、PPT 和其他常见文档格式中提取文本的开箱即用的支持。 5. Agent 智能体: 您可以基于 LLM 函数调用或 ReAct 定义 Agent,并为 Agent 添加预构建或自定义工具。Dify 为 AI Agent 提供了50多种内置工具,如谷歌搜索、DELL·E、Stable Diffusion 和 WolframAlpha 等。 6. LLMOps: 随时间监视和分析应用程序日志和性能。您可以根据生产数据和标注持续改进提示、数据集和模型。 后端即服务: 所有 Dify 的功能都带有相应的 API,因此您可以轻松地将 Dify 集成到自己的业务逻辑中。 |
Xinference | Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地一键部署你自己的模型或内置的前沿开源模型。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能 | 1. 模型推理:大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。 2. 内置模型预设:框架内置众多中英文的前沿大语言模型,包括 baichuan,chatglm2 等,一键即可体验!内置模型列表还在快速更新中。 3. 异构硬件,快如闪电:通过 ggml,同时使用你的 GPU 与 CPU 进行推理,降低延迟,提高吞吐. 4. 接口调用:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。 5. 集群计算,分布协同: 支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。 6. 集群计算,分布协同: 支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。 |