食品信息学不是食品科学里的AI跟班!食品信息学定义模糊导致研究零散。本文明确其跨学科范围,从分子到系统整合数据,说明这领域如何靠连接信息解决食品问题,而非只做单一分析。
期刊: The Innovation Informatics
发表日期: 2026年4月17日
原文标题: Food Informatics: Leveraging data and knowledge to advance food systems
作者背景: Dachuan Zhang 和 M.Z. Li 等,新加坡国立大学等机构,获新加坡教育部资助
这个领域原先乱成一锅粥
大家一说食品信息学,脑子里画面差别太大了。有人觉得就是分析食品化学成分的数据库,有人觉得是整个农场到垃圾桶的物联网监控,还有人觉得就是用AI识别你中午吃的到底是红烧肉还是糖醋排骨。这些都对,但都只抓住了一小块。就像盲人摸象,一个人摸到腿说像柱子,另一个人摸到尾巴说像绳子,谁都没错,但谁都没说全。这个问题让研究人员很尴尬。
做分子层面的兄弟搞出一堆化学数据,做供应链的兄弟姐妹也在搞一堆物流数据,大家以为自己在说同一个东西,结果开会时发现聊的根本不是一码事。
更坑的是,论文库里的知识没法累积,因为定义不一致,没法有效引用前人的结论,导致每篇新文章都得从头解释一遍“我这里说的食品信息学是指什么”。这就像每个修房子的工人都要自己先烧砖,累死累活,还砌不成高楼。
以前那些定义都只说了局部
最早的定义来自Martinez-Mayorga与Medina-Franco,他们把食品信息学看作化学信息学的亲戚。主要干的事就是用计算工具去管理食品里那些海量的化学成分数据。
比如你有一个西红柿,里面有多少种氨基酸、多少种挥发物、多少种抗氧化物,用传统方法一个一个测到天荒地老。他们觉得应该像管理化学分子库一样管理这些数据,然后搞点机器学习,预测哪种分子组合吃起来更香。这个想法在当时很先进,但问题在于,它只看分子,不看整个食物。就像一个只研究食材化学配比的厨师,可能做出化学成分完美的菜,但吃起来像鞋垫。
后来联合国粮农组织进场了,他们搞了个农业信息学,用卫星遥感、地理信息系统这些技术去整合农业数据。比如哪块地种了多少玉米,今年的降雨量够不够,虫害预警怎么发。这个视角又跳到了系统和田间管理层面,直接从卫星看大地。但它很少管分子层面的事,也不关心你锅里那块肉的具体化学成分。所以实际上,粮农组织的定义和化学信息学那套定义,虽然都挂着信息学的名头,但根本不对话。搞化学的人听不懂搞遥感的人在说什么,反之亦然。
再后来,Krupitzer与Stein给了个更宽的定义。他们说食品信息学是物联网和人工智能在整个食品生产链上的应用,从田地到物流,从加工到零售,从吃到垃圾分类回收,全包了,还加上了循环经济的考量。
这个定义好在哪里?好在它第一次明确说出了“整条链”。但问题也来了,它把食品信息学当成了其他行业的工具,好像食品信息学就是给食品安全、供应链管理、农业这些老大哥打杂的小弟。这就导致这个领域没有自己的核心问题,没有自己的独特方法,总是在回答别人的问题。就像一个总在帮邻居修水管的人,自己家的水龙头坏了反而没人管。
我总结一下上面的混乱原因
这些定义之间的差异,说到底不是谁对谁错,而是大家看问题的角度不同。有人习惯从分子层看,有人习惯从食物性质层看,有人非要从系统层看。食品系统本来就是个多尺度的东西,从分子到胃再到全球供应链,跨度巨大。如果你只允许其中一个层面代表整个领域,那另外两个层面的研究就自然而然地被边缘化,或者更惨,被强行塞进不合适的框架里。比如一个做食物感官评价的人,他的数据是人群试吃打分,你非要他用化学信息学那套分子描述符去建模,这不是不行,但很别扭,就像用叉子喝汤一样,能喝到一点,但效率极低。
所以我们需要一个定义,不是让三个层面打架,而是让它们好好合作。这个定义要把它们都装进来,并且说清楚它们之间是什么关系,而不是简单地把它们堆在一起。就像盖楼,不是把砖头、钢筋、水泥随便堆在一块,而是要有梁有柱有楼板,让它们互相支撑。
我们提出新定义来统一战场
基于前面的讨论,我们把食品信息学重新定义如下。
食品信息学是一个跨学科领域,负责获取、组织、分析和解释食品相关的数据与知识。
它站在食品科学、信息学、计算科学的交叉点上,目标是在整个食品系统里实现知识发现、决策支持和优化。
这个定义的核心在于,它不强调用什么工具,也不强调解决什么具体任务,而是强调数据与知识的流动。就是不管你用机器学习、物联网、还是生命周期评估,只要你在做食品数据的获取、组织、分析、解释,你就在做食品信息学。
这句话看起来简单,但威力很大。因为以前做生命周期评估的人觉得自己在做环境工程,做食品图像识别的人觉得自己在做计算机视觉,做食品代谢组学的人觉得自己在做分析化学。大家各干各的,互相不知道对方在干嘛,甚至互相看不起。
现在这个定义告诉他们,你们其实都在干同一件事的不同侧面。生命周期评估分析的是系统层的环境数据,图像识别分析的是食物层的外观数据,代谢组学分析的是分子层的化学成分数据。这些数据虽然尺度不同,但都是食品数据。把它们放在同一个框架里,才是食品信息学的完整面貌。
它在中层连接上下数据
按照我们的新定义,食品信息学在三层之间干活。
最底层是分子与配料信息。比如某个化合物是什么结构,它对苦味的贡献有多大,它在哪种食物里含量最高。
中间层是食物与产品层面的信息,包括配方、加工参数、感官属性。比如这个面包的配方是什么,发酵温度多少度,烤出来表皮多脆,吃起来有多香。
最上层是系统层面的信息,包括供应链、消费模式、废弃物处理。比如这批番茄从农场到超市走了多少公里,过程中排放了多少二氧化碳,最后有多少被消费者扔掉。
这三层不是独立的流水线。上层的问题往往需要下层的数据才能回答,下层的发现也需要上层的验证才有意义。
举个例子,你想设计一种低糖但口感不差的巧克力。只改配方是盲目的,你可能得试几百次才能碰到一个可行的。但如果把下层的数据(各种糖替代品的分子结构与甜味受体结合能力)与中层的数据(相同替代品在不同基质中的感官评分)与上层的数据(这些配方的原料供应链碳排放)连接起来,你就可以在一个统一的模型里同时优化甜度、口感和碳足迹。这就是三层连动的威力。
跟它长得像但不一样的几个兄弟
有几个概念经常跟食品信息学混在一起,我们需要把它们分清楚,免得你以后看论文时脑袋爆炸。
第一个是AI在食品科学里的应用。这个方向的核心就是拿AI模型去干具体的食品任务,比如用卷积神经网络判断鸡排炸得够不够脆,用分类模型预测牛奶会不会变质。它的重点永远是模型的预测准确率,而不是这个领域本身的学科结构。就像一个特别会修拖拉机的师傅,你怎么问他怎么修飞机,他可能就答不上来了。
第二个是食品组学。这个听上去很高大上,其实就是用基因组学、蛋白质组学、代谢组学那套分子层面的大规模分析技术,去刻画食品的化学成分和功能。比如你拿到一个神秘蘑菇,不知道里面有没有毒素,食品组学的办法是把它的所有代谢产物全扫一遍,然后跟已知毒蘑菇的代谢谱比对。它的强项在分子指纹,弱项在于不太管这个蘑菇在市场里怎么流通、怎么被消费者接受。
第三个是食品计算。这个方向主要来自计算机科学与人机交互社区,关心的是任务导向的应用,比如拍一张菜的照片,识别出这是麻婆豆腐,然后算出这道菜的热量,再接着推荐你晚餐最好吃沙拉。它特别接地气,很多手机App都在用,但它的范围比较窄,不涉及分子层或者系统层的复杂整合。
第四个是计算美食学。这个用数据驱动的方法分析食谱、风味搭配、食材组合的规律。比如爬取几百万个菜谱,发现蓝莓跟迷迭香一起出现的频率远高于随机机会,然后推测这两种味道可能在化学层面有互补关系。它很有趣,也能带来创意,但它主要停留在烹饪层面,不覆盖整个食品系统。
我们的食品信息学跟它们都不一样。它不是被某一个方法或某一个任务定义的。它强调的是在整个食品系统里,怎么表达、整合、分析那些五花八门的数据和知识。你可以把AI在食品科学、食品组学、食品计算、计算美食学看作是四个专门做特定活的施工队,而食品信息学就是那个总平面图加项目经理,负责让这几个施工队的信息能对接,让他们的成果能拼成一个完整的建筑,而不是各盖各的违章搭建。
拿实际研究案例来证明它能干活
我们来看几个真实的研究案例,你就会发现食品信息学不是嘴上说说的框架,而是已经产生了硬核结果。
先看分子层。有研究人员整合了一个巨大的食品化合物数据库,里面有七万多个跟食品相关的分子。他们分析后发现,食品化学分子占据的化学空间,比常见的天然产物或者已经批准的药物分子都要宽广得多,也多变得多。换句话说,食物的化学多样性远超我们以前的想象。这个结论不是靠尝出来的,也不是靠猜出来的,而是靠数据整合与比较分析得出的。这就是信息学在分子层的力量,你不需要一个一个分子去合成验证,就能看到全局模式。
再看食物与产品层。有研究把食物的图像数据和仪器分析数据结合起来,用机器学习模型去给番茄、苹果、草莓这些水果分类和定级。结果发现,模型的准确率高得离谱,比很多人工分级员的稳定性和重复性都好。这意味着你不用靠那个干了三十年的老师傅瞪着眼睛一个一个挑苹果了,你只需要拍张照或者跑一跑光谱数据,算法就能给出客观、可重复、可规模化扩大的评价。这节省人力倒在其次,最重要的是它消除了人为判断的随机性,让食品品质信息变得可比较、可累积。
最后看系统层。有研究整合了大量生命周期评估的数据集,覆盖了全球食品供应链里大约三万八千多个农场。结果发现一个惊人的事实,生产同一款产品,不同农场的温室气体排放量可以相差五十倍。而且对于很多食品,排放量最高的那百分之二十五的农场,贡献了超过一半的总排放量。
这意味着什么?意味着我们不需要对每个农场下猛药,只要找到那四分之一的大户,帮他们改进一下,整个行业的碳足迹就能降一大截。这种洞察,没有数据整合与系统层的信息学分析,是绝对看不出来的。
接下来要往哪五个方向走
第一个方向,把各层数据真正连起来。现在很多研究仍然只盯着一层。
分子层的人发分子的文章,食物层的人发食物的文章,系统层的人发系统的文章,互相之间很少有交叉验证和联合分析。未来的突破在于打通这三层。比如你从分子层的化学成分数据,直接预测食物层的感官体验与营养结果。这样一来,你不需要做出实物就能知道一个配方吃起来大概什么感觉,健康上有什么影响。同样,你也可以把食物层的特性和系统层的数据集连起来,看看某个具体的加工方式或配方选择,放到真实的供应链里会变成多少吨碳排放。这些跨尺度的整合,才是真正的难点和机会点。
第二个方向,把数据基础设施搞扎实。现在很多数据集要么太零碎,要么格式不统一,要么是谁手搓出来的没有记录来源。这就导致你想重用别人的数据做二次分析时,发现根本用不了,或者不敢用。推动食品信息学往前走,需要系统的数据整理工作。数据从哪里来、经过哪些处理、可信度多高,这些信息要清清楚楚。还要建立互操作标准,让分子层、食物层、系统层的数据能像乐高积木一样拼起来,而不是一个需要胶水一个需要锤子。
第三个方向,从预测转向探索和设计。以前大家习惯干的事情是,我有个模型,我来预测一下这个食品的某个属性。这没错,但不够。食品信息学更大的潜力在于,它能帮我们提出新的假设,探索那些用传统试错法根本无法触及的食品设计空间。比如你从来没想过巧克力里加某种海藻提取物是什么口感,数据模型可以在虚拟空间里先把它模拟出来,然后告诉你这个方向值得一试,再分析一下它在质量、营养、安全、可持续性之间的利弊权衡。这就是从“我能预测”进化到“我能创造”。
第四个方向,把计算模型、真实实验和领域专家知识捏得更紧。食品行业里做个实验成本不低,买个原料、跑一个生产批次、请一组感官评价员,都要花时间花钱。所以你不能全靠模型瞎蒙,也不能全靠人工蛮干。人机协同的流程会越来越重要,模型帮专家缩小搜索范围,专家帮模型纠正离谱的错误。这种合作模式,在数据收集成本高、专家经验仍然是金标准的场景里,特别管用。
第五个方向,教育和培训要跟上。你定义再漂亮,没人会用白搭。还好现在已经有一些大学开始在干了,新加坡国立大学、瓦赫宁根大学与研究中心、霍恩海姆大学都陆续开了专门的课程或者学位项目。接下来需要更多学校跟进,让训练食品信息学的人才变得更普遍,而不是少数几个地方的奢侈品。培养出一批能用数据连接分子与地球的新一代研究者,这个领域才算真正站稳了脚跟。
结论就一句话
食品信息学不是任何单一工具的奴隶,也不是任何单一任务的仆人。它是一个把分子、食物、系统三层数据与知识连接起来的跨学科框架。以前各玩各的,谁也说不清自己在哪个球队。现在我们给了它一个清晰的定位和球衣,接下来就看大家怎么传球配合了。
致谢与资助
本研究得到了新加坡教育部学术研究基金一级(A-8003718-00-00)和新加坡国立大学启动基金(A-0010237-00-00)的支持。作者使用了AI工具进行语言润色和语法检查,并对内容与结论负全部责任。资助方在研究设计、数据收集与分析、发表决策或手稿准备中没有任何角色。
作者贡献
D.Z.与M.Z.L.设计了研究。M.Z.L.与D.Z.撰写了论文初稿,C.F.提供了输入意见。所有作者都参与了手稿修订并批准了最终版本。
利益声明
作者声明不存在竞争利益。