大模型时代,南大周志华埋头做学件,最新论文上线

在大模型时代,南京大学的周志华教授专注于研发创新,他提出的“学件”理念正在机器学习领域引发变革。学件范式通过模型与规约的结合,构建了学件基座系统,简化用户获取和定制适合任务的模型过程。这个全新的平台——北冥坞,作为首个开源的学件基座系统,其37页的论文揭示了其技术深度。

传统机器学习面临数据需求大、复用困难、适应性差和隐私问题等挑战。学件范式旨在通过统一的学件格式,解决这些问题,允许用户无需数据共享就能利用全球开发者贡献的模型。它通过模型规约保护数据隐私,用户可以搜索和复用学件来完成任务,无需担心数据泄漏。

周志华团队构建的北冥坞,作为学件范式的基础研究平台,以可扩展架构和优化工程实现,支持模型提交、测试、管理和复用的全程。用户只需几行代码,就能利用现有学件解决新任务,显著降低了开发复杂度。

尽管北冥坞当前的学件库尚有限,但它预示着未来学件范式将能更好地适应多样化的任务和场景,实现模型的高效复用和个性化定制。研究者强调,通过持续的学件提交和算法提升,学件基座系统将不断进化,成为更多用户任务的解决方案。

论文深入探讨了北冥坞的设计,包括其层次结构、核心引擎(基于规约的学件管理)、后台支持和用户界面,展示了学件范式如何通过系统性管理和复用,为机器学习任务带来显著优势。

实验评估部分展示了学件在表格、图像和文本数据上的性能,即使在数据有限的情况下,学件复用也表现出优于自训练模型的性能。学件基座系统的潜力和实用性,为大模型时代的机器学习实践提供了新的可能。