古巴农业网 >> 原生植物

大数据:“互联网+”基因检测技术刺茉莉属

2022-07-13
大数据:“互联网+”基因检测技术
基因检测,一个无核心技术,无优质自主产品,无大数据库的行业,因为诱人的前景,已然成为一个大江湖。
或大或小,或有或无检测能力的公司混杂其间,有些只是负责产品推广,有些只是负责行业检测外包,他们都想插上互联网的翅膀,一飞冲天。但是,数据库的建设是个漫长的过程,数据库的管理和利用也需要法规和行业自律。在这些未完成之前,一切都只是梦想。
互联网+的下一个风口是谁?
基因检测行业值得关注。
苹果公司、谷歌公司、阿里巴巴等互联网公司,平安保险、泰康人寿为首的保险企业,都在布局基因业,基因+互联网,对于双方产业具有明显的战略意义。作为中国基因检测的龙头,12日18日华大基因终于出现在证监会公布的IPO排队名单中,第二大股东即是保险公司。
尽管已成投资热点,但是《国际金融报》记者调查发现,国内基因检测行业不直接掌握基因测序的核心科技,检测仪器也以进口产品为佳。那么国内基因产业的核心竞争力何在?一些业内人士在接受记者采访时直言,大数据。
为了实现公司的大数据梦,基因检测公司都想插上互联网的翅膀。也正因为有了这份期待,业内预计,未来几年,千亿投资将进入基因产业。
核心技术在哪
国内基因公司并不直接掌握基因测序的核心科技,花钱买套测序仪、拉几位生物医学专家组成团队,就能创立一个基因公司,基因公司的同质化现象非常严重
如果对每个准妈妈都进行染色体异常检测,估计可以把残疾儿童出生率降低90%。截至目前,中国有约80万人接受检测。
我们想做的,是到2020年,新生儿先天性缺陷的概率降低一半,人类寿命延长5-10岁,而且是健康的5-10年。与许多基因检测公司创始人一样,华大基因创世元老李英睿对基因研究充满期待和热诚。
但是,《国际金融报》记者采访基因产业内多位高管,发现业内有个基本的共识:国内基因公司并不直接掌握基因测序的核心科技,花钱买套测序仪、拉几位生物医学专家组成团队,就能创立一个基因公司,基因公司的同质化现象非常严重。
基因测序技术的攻克,6个国家用13年的时间花了38亿美元才完成。国内的大型检测仪器和试剂一般都严重依赖国外。也就是核心技术在人家那里,你就是花钱买。这就导致了,我国在生物医学领域一直是处于食物链的底层。包括一些国内大亨级企业也是这样的。业内人士坦言。
目前,国内公司进入基因测序行业一般采取两条路径:一是通过与国外仪器生产商合作,授权或买断产品,到国内贴牌。这种模式虽然用的是国外的仪器及技术,但申报中国食品药品监督管理局(CFDA)走的是国内的仪器设备通道,申报与审批相对比较快,正常审核时间约为1-1.5年。如贝瑞和康(与Illumina合作生产新型测序仪)、华大基因的BGISEQ1000(滇南黄杨基于CompleteGenomics的测序平台)、达安基因的DA8600(基于LifeTechnologies的IonProton测序平台)都是采用这种模式。另一条是自主研发的模式,如紫鑫药业(和中科院基因组所合作)。紫鑫药业的基因测序仪采用的焦磷酸发光测序技术,类比的是与Roche454类似的基因测序技术。科研机构中,中科院基因组所的于军教授和北京大学的谢晓亮教授都是该领域中的领先研究者。
从基因检测产业链的上中下三个层面剖析该行业,会更清晰地认识行业窘境。
处于产业链上游的是基因检测仪器与耗材试剂,国外的主要公司是Illumina、LifeTech以及Roche,国内多采取与国外公司合作授权的形式,主要公司有华大基因、贝瑞和康与达安基因,从事自主研发的公司主要有紫鑫药业等。
中游是基因检测服务。现今国内最主要也是最成熟的基因检测服务是产前基因检测,美国的主要公司有Sequenom,VerinataHealth,AriosaDiagnostics和Natera;国内市场主要被华大基因及贝瑞和康垄断,其他公司还包括达安基因、诺和致源、安诺优达等。
在淘宝网输入基因检测,儿童天赋、恋爱配对等新奇好玩的检测项目丰富,但娱乐性的检测准确性如何?
对于基因检测环节,专业做胃肠道微生物基因检测的Hcode公司创始人胡鹏告诉《国际金融报》记者,基因检测分三类,科研、临床、娱乐,个人的娱乐性检测暂时没有监管措施,像一些公司提供的检测服务,没进入医疗机构,暂时都没有非常明确的监管,临床指的是进入医疗机构的检测服务,用到的试剂和仪器需要卫计委和卫生部的审批。
除了人类基因检测,人体内微生物、农作物的基因检测,也是重要内容,检测微生物的基因,是提高人类胃肠道健康的必要手段,而胃肠道癌症是亚洲人最高危的致死癌症。胡鹏正在为100人免费做12次基因检测,以帮助人类理解微生物与人类肥胖的关系。
数据监测出来后,需要进行数据解读,这是基因检测产业的下游环节,已被全球公认为是比测序还要重要的环节。深圳弘睿康生物科技有限公司CTO告诉《国际金融报记者》,基因检测公司的核心差异在于对数据的解读。
要想让解读准确,检测数据库要足够大,而这正是胡鹏目前最缺乏的。
大数据该如何建
如果没有百万级的样本来做对照,你很难真正断定某个人是否容易患某种癌症,因为基因测序只是告诉你某个人的基因是怎样的,但他患某种疾病的风险有多高,这个需要与众多患者做基因对比。遗憾的是,中国没有统一的基因数据库,基因数据零零散散地掌握在科研机构、企业手里
当《国际金融报》记者向上海科委某处长询问上海的基因政策时,他告诉记者,应该关注王俊的动向——王俊作为基因产业创新的引领者,这也代表了基因业外部人士对基因产业的基本理解。
华大基因创始人王俊直言:以后基因检测不在于测序技术本身,而在于大数据。王俊目前已辞去华大基因CEO职位,全力创立碳云科技公司,据传已经得到阿里巴巴等互联网公司投资,但王俊在电话中告诉《国际金融报》记者,等春节前后等我公布。
王俊10月公开宣布,要做到2016年基因检测免费,而对于《国际金融报》记者关于如何免费的问题,王俊反复强调:等我做出来再说。
其实,基因测序所生成的原始数据并不能直接反映有价值的信息,必须通过专业人员进行分析和解读。现今的生物信息分析涉及的数据存储、解读及共享是整个基因测序行业目前面临的最大难题,主要原因一是来自于数据量的庞大,二是源于数据的复杂性。大数据成为基因行业的发展瓶颈。
胡鹏遇到的困难也是基因检测行业的共同瓶颈——缺乏数据,像胡鹏一样免费做基因检测的公司创始人,为了获得检测数据,都有自己的互联网战略。
数据分析和解读可能会成为中国企业的优势,但短期只能烧钱看不到回报,门槛是数据库,这是限制企业数量和规模的主要原因。
基因数据到底有多复杂?华大基因的内部人士坦言,我们每个人的基因组大小单倍体是3Gb,基因测序深度30倍才能拿到比较全面的信息,也就是90Gb的数据量,百万人的基因组就是将近100Pb的海量数据,当然,这只是基因组数据,还不包括基因表达变化数据、体征数据等日常产生的生命信息数据。如此海量的数据,对数据的处理要求在目前的技术环境下,存在超级计算机和云计算两种策略,但云计算天然的互联网背景则更符合社会潮流发展的趋势。
首先就样本量而言,如果没有百万级的样本来做对照,你很难真正断定某个人是否容易患某种癌症,因为基因测序只是告诉你某个人的基因是怎样的,但他患某种疾病的风险有多高,这个需要与众多患者做基因对比。胡鹏告诉记者。
华大基因被认为是国内基因企业中样本量最大的,仍然不足胡鹏所说的百万人群的样本量。华大基因在2015年1月启动百万人基因组项目,计划同时完成百万数量级的人类基因组等一系列数据收集分析工作,目前尚未宣布完成百万人的基因检测。
《国际金融报》记者进一步调查了其他基因公司。贝瑞和康、达安基因以及博奥颐和三家基因公司的官网均无数据库样本量信息,记者电话咨询公司相关人员,但截至截稿时三家公司未回应。
储存、处理、解读海量基因数据是浩大的工程,而且只有基因数据还远远不够,必须与其他多维度的数据融合,才能生动描画出一个活生生的人。
如果你只知道基因数据,无法与他的生活数据相结合,一是会影响对基因数据的解读,二是即使解读出基因数据,也需要把它进一步应用在实际生活中,这就需要全面、多维的生动数据。胡鹏告诉《国际金融报》记者。
严酷的现实是,中国没有统一的基因数据库,基因数据零零散散地掌握在科研机构、企业手里,而因为各自利益难以融合,国内的样本库多孤立、割裂,资源难协调,样本共享无标准,全国化、统一化、标准化的资源共享平台还有待建设。
除了企业,政府在引导设立基因库吗?据公开信息,目前国家基因库设在深圳。
深圳国家基因库是依托华大基因组建及运营的中国首个国家基因库。目前一期工程基本完成,样本量约840万份。按规划,2015年前建设完善生物资源样本库及配套设施,预计将保存1000万份可溯源的生物实验样本。其中,人的样本,尤其是与已选健康相关的样本会占大多数。截至12月24日,据国家基因库官网所示,国家基因库人类遗传资源样本库样本总量为568万。
大企业为何布局
截至目前,无论是国内还是海外,保险公司和互联网公司都热衷于投资基金检测创业企业
尽管技术上、数据收集和分享上,还存在不足,但是金融业、互联网企业正参与其间。一些拥有强大数据处理能力的互联网公司纷纷挺进基因数据产业,而保险公司也利用基因数据来设计更高收益的保险产品。
泰康不是保险公司,不是金融企业,而是以生命健康为主业的公司。陈东升在出席北京武汉商会活动时说,泰康将逐渐把生命健康产业总部迁移到武汉,要在武汉打造生命健康城,基因产业是10万亿规模的产业。
除了泰康人寿,包括平安寿险、中国人寿集团、太平人寿集团在内的的多家险企纷纷推出买保险送基因检测增值服务。
而谷歌在重组为字母表公司后,以基因为首的生命科学公司也被置于集团更核心的地位。苹果正在与美国多家研究机构合作,计划收集并整理用户的基因数据,帮助iPhone用户进行基因检测。而亚马逊也推出云端服务,并接管国际千人基因组计划数据存储。
在国内,阿里、腾讯、百度这样的互联网巨头也不甘其后,先后投资基因公司或者自己设立基因数据部门。
10月22日,阿里云与英特尔、华大基因共同签署战略合作备忘录,宣布启动弓箭中国就乃至亚太地区首个精准医疗应用云平台。此前,阿里云还与北京贝瑞和康生物技术有限公司达成合作,共同打造以海量的中国人群基因组数据为核心的数据云,实现对个人基因组数据的精准解读。
12月22日,百度与协和医院宣布开展食管癌研究,成为国内互联网企业与国家级医学科研机构在癌症领域的首次深度合作。根据项目计划,百度将为研究所采集的大量基因数据的储存提供帮助,百度的大数据以及人工智能的引入,能够加速生物信息的相关计算。
如果你在买保险产品前,保险公司让你做基因检测,某些你可能高危的疾病,就不提供保险,或者保险公司专门设计出,大多数人并不容易发生的疾病险,那么保险公司石胡荽的收益将大大提高。基因业内人士告诉记者。
如何用好互联网
一方面,基因创业公司应高度互联网在线化;另一方面,基因数据实现指数式增长时,要管理好这些数据
基因公司不仅在吸收外部资本,自己也转身为平台,孵化产业链上下游企业,典型案例如华大基因每年投资20家生命科学公司;达安基因投资了自己的基金公司,花了人民币1330万元投资了中财国开医疗健康养老先导基金管理(深圳)有限公司。
华大基因2013年3月完成对美国基因测序公司Complete Genomics的收购,借此机会占领了基因测序的上游。9月23日,由华大基因发起,松禾资本、同创伟业等机构共同投资的孵化器正式启动。这个被称为蓝色彩虹的基金专注生命科学。据华大基因介绍,华大基因将向该平台开放科研、仪器、大数据、专家、行业等资源,计划每年投资20家生命科学初创公司,先期布局国内一线城市和美国硅谷、波士顿。
在基因测序产业内部,众多中小科技公司正成为细分领域的领头羊,他们借助的正是互联网力量。
胡鹏之前在华大基因负责网络部,但他看到了基因产业的巨大前景绝不仅仅在于华大基因已经投资的领域,于是在2014年底创立了Hcode公司,短短数月后,华大基因为肠道微生物检测,就要使用Hcode的产品了。
作为一个拥有最多高学历人才的行业,居然没有实现高度的互联网在线化,这是一个奇怪的现象。在罗奇斌看来,基因+互联网是必然趋势。
罗奇斌预测,基因行业会诞生一批企业,即从生物信息分析切入,形成一个数据分析大平台,然后向上游移动,将测序仪器及建库和试剂上线,最后将样本物流系统在线化。另一方向下游移动,将应用出口通过云端实现在线,最终实现产业链的闭环,互联网+在基因行业得到实现。
与罗奇斌一样,胡鹏正在构建以微生物基因为核心的生态系统,使基因公司、互联网公司、医药公司等相关企业能共享。例如,医药公司研发药品,有了基因数据做基础,新药开发的速度将大大提升,减少死亡率。对于互联网公司,某些基因特征的人群喜欢什么、需要什么,就变得一目了然,互联网公司应用这些数据将大大减少无用功。胡鹏告诉记者。
既然数据是限制基因产业发展的瓶颈,那在基因数据实现指数式增长前,基本的问题是,谁才有资格管理大众的基因信息呢?在美国,由医疗机构、研究型大学、生命科学公司组成的全球基因组学与健康联盟,就是专门解决基因数据存储在哪,谁有访问权限,如何保护隐私等问题,联盟成员之一的谷歌认为私人数据依然保密,公共数据开放给任何人。
胡鹏认为中国也应尽快建立行业联盟,各界应该联合起来,一是解决基因数据不愿意共享的问题,某些研究你已经做过了,但你不愿意共享,那别人就要重新做,造成巨大资源浪费,如果我们大家都愿意共享,那人类对基因的认识和利用将数倍于目前。二是解决用户的需求问题,例如你去检查胃肠道,要提前几天清胃、清肠,后期还要有长期的治疗或保养,而如果你能与胃肠健康的各家机构联合,那你只需要去医院一次就能得到打包式的一站式服务。
文字修改简单h5模版
商务答谢宴邀请函
环卫工人节海报制作
植树节海报设计
友情链接