deecamp人工智能训练营值得去吗(deecamp人工智能训练营2021)

抖店动销抖店体验分提升抖店任何业务可添加微信:ad07668

由镁伽科技携手创新工场、清华大学智能产业研究院等联合举办的2022DeeCamp人工智能训练营暨创新挑战赛已于4月25日正式开启报名。截至目前,已收获包含中国科学院大学、清华大学、北京大学、南洋理工大学、约翰?霍普金斯大学等国内外高校同学的热情参与。今

deecamp人工智能训练营值得去吗(deecamp人工智能训练营2021)

镁伽科技携手创新工场清华大学智能产业研究院等联合举办的2022DeeCamp人工智能训练营暨创新挑战赛已于4月25日正式开启报名。截至目前,已收获包含中国科学院大学清华大学北京大学南洋理工大学、约翰?霍普金斯大学等国内外高校同学的热情参与。

今年的17道创新赛题涵盖AI与生命科学、临床诊断、工业制造等时下多个热门领域,此次镁伽科技作为战略合作伙伴,在大赛的三大赛道五个赛题中担任出题方。同时,我们也为同学们获取了官方独家福利,抢先公开这五个赛题的详细信息。

快来选择你感兴趣的题目一起加入吧!也许,这就是你改变世界的起点。(报名请点击右侧链接:镁伽科技携手创新工场,DeeCamp2022正式启动!)

生命健康赛道

▲课题导师,镁伽科技首席科学家王承志解读赛题

赛题:

基于代表性基因集的全基因组表达预测

赛题标签:

基因表达谱

课题描述:

大规模基因表达谱获取已经被广泛地用于识别各种疾病条件、遗传扰动等条件下的细胞状态。尽管当今全基因组表达谱的测量成本已经被降到很低,但动辄上千个样品的测序依旧是高昂的开支。认识到很多基因间的表达经常是高度相关的,来自美国NIH LINCS组织的研究人员开发了一个由约1000个基因组成的panel(L1000)[1],并通过这个panel中的基因表达情况预测其他基因的表达,从而达到获取整个表达谱的目的。但早期LINCS用到的算法是简单的线性回归,无法捕捉复杂的线性关系,近期基于深度学习的算法被应用于这一计算问题的解决,并实现了更高的准确性[2]。而更进一步地,L1000基因的挑选是基于小分子药物筛选中的关键基因,但并不一定是满足转录谱预测最合理的panel。因此,如果能重新设计一个用于预测全基因组表达谱的更精炼或更有代表性的panel,不仅是个很好的计算问题,也有较大的应用价值。

课题说明:

1. 新panel基因的选择,目的是找到在预测转录谱中更有代表性的基因。最理想的方案是预测准确度更高、基因个数更少的panel。

2. 可以尝试各种方法,包括组合优化、图网络等,基因选取与后续的转录谱预测是两个独立或不可分割的环节。

参考信息:

[1] Subramanian A, et al. A Next Generation Connectivity Map: L1000 Platform And The First 1,000,000 Profiles. Cell. 2017/12/1. 171(6):1437–1452.

[2] Chen Y, et al. Gene expression inference with deep learning. Bioinformatics. 2016. 32(12): 1832–1839.

参考数据:

[1]https://cbcl.ics.uci.edu/public_data/D-GEX/GD462.GeneQuantRPKM.50FN.samplename.resk10.txt

[2]https://cbcl.ics.uci.edu/public_data/D-GEX/GTEx_RNASeq_RPKM_n2921x55993.gctx

[3]https://cbcl.ics.uci.edu/public_data/D-GEX/bgedv2_QNORM.gctx

[4]https://cbcl.ics.uci.edu/public_data/D-GEX/l1000_n1328098x22268.gctx

赛题:

癌症相关知识图谱的构建

赛题标签:

疾病知识图谱

课题描述:

药物的发现和开发是一个复杂而昂贵的过程。机器学习正在研究各种方法来帮助药物开发管线的多个阶段提高效率和速度。其中,使用知识图谱knowledge Graphs(KG)在许多任务中都有应用前景,包括药物再利用、药物毒性预测和筛选基因与疾病关系的优先级。用于药物发现的知识图谱包括基因、疾病和药物在内的关键元素被表示为实体,而他们之间的关系被表示为相互作用关系。目前有很多已经存在的结构化的知识图谱,如Hetionet,DRKG等。尽管如此,科学文章中仍有大量与各种癌症(或其他疾病)相关的信息。因此我们非常需要一个最新的基于科学文章挖掘的知识图谱来帮助我们理解各种复杂的疾病。

课题说明:

本赛题是开放课题,团队可选择一个或多个癌症(或其他疾病)方向,构建高质量基于NLP信息萃取挖掘的知识图谱。

参考信息:

[1] 生物医学领域相关知识图谱综述:https://arxiv.org/abs/2102.10062

[2] 预训练模型论文:

Biobert:https://arxiv.org/abs/1901.08746

Pubmedbert:https://arxiv.org/abs/2007.15779

Hetionet图谱开源地址:https://github.com/hetio/hetionet

Drkg图谱开源地址:https://github.com/gnn4dr/DRKG/

[3] 相关预训练模型的开源地址

BioBert :https://github.com/dmis-lab/biobert

Pubmedbert:https://microsoft.github.io/BLURB/models.html

生物医学自然语言处理的资源集合(BLURB): https://microsoft.github.io/BLURB/

参考数据:

[1] 文本数据来源可以通过在PubMed(https://pubmed.ncbi.nlm.nih.gov/)等各种医学文献数据库进行关键词搜索(例如:肺癌的搜索策略为“(Lung Carcinoma*) OR (Lung Adenocarcinoma*) OR (Pulmonary Cancer*) OR (Lung Cancer*)OR (Pulmonary Neoplasm*) OR (Lung Neoplasm*) OR (lung tumor*)”)得到相关的摘要或全文。

[2] 附六大医学文献数据库:中国生物医学文献数据库(CBM) …

Embase. …

中国知网全文数据库(CNKI) …

Medline. …

Cochrane 在线图书馆 …

OVID 电子期刊全文数据库(OVFT)

工业赛道

▲课题导师,镁伽科技AI科学家孙新解读赛题

赛题:

芯片表面小尺寸缺陷检测

赛题标签:

缺陷检测/工业

课题描述:

AI技术已广泛应用于工业缺陷检测领域,在部分背景相对单一的产品上取得了很好的效果。然而在背景比较复杂的产品,比如半导体芯片、晶圆、显示面板等产品上面,因为缺陷区域与背景区域的对比度差别较小、形状近似等原因,现有的常规AI算法容易表现出较多的误检和漏检问题。同时,在显示面板、芯片半导体等领域,由于产品本身的精密度较高,缺陷的尺寸大多比较微小,再加上行业自带的样本均衡性问题,缺陷检出具有一定挑战性。如果设计出一套模型结构与方法,能解决复杂背景下的小尺寸缺陷检测问题,无疑会提升整个行业的产品良率,进而增加中国制造的含金量。

课题说明:

1.本赛题侧重于提升复杂背景下小尺寸缺陷的检出率、降低误检率,同时尽量提升算法的运行效率。

2.团队可以选择算法精度优化方向,也可以选择算法速度提升方向,亦可二者兼顾。

3.本赛题要求构建出的算法模型可运行,并能在测试集上统计效果。

4.更多泛半导体行业数据,开赛前以非公开形式提供给参赛队伍。

参考信息:

[1]https://blog.csdn.net/qq_40716944/article/details/120059527

[2]https://github.com/Charmve/Surface-Defect-Detection/tree/master/Papers

[3]https://zhuanlan.zhihu.com/p/375828501

参考数据:

[1] https://github.com/zae-bayern/elpv-dataset

[2]https://zhuanlan.zhihu.com/p/260181083 [3]https://cloud.tencent.com/developer/article/1759556

赛题:

半导体柔性生产下的表面缺陷检测

赛题标签:

缺陷检测/工业

课题描述:

当前工业产品生产制造的需求越来越碎片化,同一生产线可能被要求在短时间内数次调整并生产近似却不相同的产品,换型速度在很大程度上制约着相关企业接订单的能力。AI算法已广泛应用于工业生产制造领域,生产线的频繁换型也对AI算法的适应性提出了更高要求,小样本学习、自监督学习、持续学习等方向的探索方兴未艾。因此我们尝试打造一套适用于频繁换型情况下的工业产品缺陷检测算法,必然能解决相关企业的痛点需求。

课题说明:

1.本赛题是开放课题,团队可选择一个或多个半导体相关数据集,构建适用于频繁换型情况下的工业产品缺陷检测算法。

2.更多泛半导体行业数据,开赛前以非公开形式提供给参赛队伍。

参考信息:

[1]https://blog.csdn.net/xixiaoyaoww/article/details/111399313

[2]https://zhuanlan.zhihu.com/p/424466348

[3]https://arxiv.org/abs/1904.05046

参考数据:

[1]https://zhuanlan.zhihu.com/p/436822956

[2]https://github.com/zae-bayern/elpv-dataset

[3]https://zhuanlan.zhihu.com/p/260181083 [4]https://cloud.tencent.com/developer/article/1759556

AI化学赛道

▲课题导师,镁伽科技AI科学家孙新解读赛题

赛题:

AI化学合成关键技术探索

赛题标签:

AI化学/反应相似性检索/路径规划与搜索

课题描述:

随着人工智能在科学研究赋能方面的进一步深入,AI技术近两年开始助力合成化学的自动化与智能化。

化学反应不计其数,在不同条件下又变化无穷。如何规划出简洁、可行的合成路线是困扰化学家的一大难题。科研人员借助大数据与人工智能算法高效搜索与优化反应路径,实现可靠的逆合成分析,有望大大提升研究效率。

在化学信息学中,传统单个分子的相似性检索已有较成熟的解决方案,然而由于化学反应往往涉及多个化合物、每个化合物在反应中涉及到结构转换和电子迁移等原因,导致化学反应相似性检索的难度远大于分子检索。设计出一个高效的化学反应检索算法将对化学合成产业产生巨大的积极影响。

课题说明:

本赛题是开放课题,参赛团队可选择一个或多个侧重方向,包括但不限于:

1.在给定单步反应模型的基础上更有效地预测出合适的反应路径。可以把它看成是路径规划的问题,也可以以强化学习的视角来看待它,更可以将它看作是广义的搜索问题。参赛团队可以从多学科、多角度去探索。

2.设计反应相似性检索算法,确保检索出的化学反应机理和官能团种类要尽量保持一致,化学反应的结构骨架要足够相似。

参考信息:

[1]http://proceedings.mlr.press/v119/chen20k.html

[2]https://pubs.rsc.org/en/content/articlehtml/2020/sc/c9sc03666k

[3]https://pubs.rsc.org/en/content/articlehtml/2020/sc/c9sc05704h

[4]http://rdcu.be/cenmd

[5]Duvenaud, D. K. et al. Convolutional networks on graphs for learning molecular fingerprints. In Proc. 28th International Conference on Neural Information Processing Systems Vol. 2, 2224–2232 (NIPS, 2015).

[6]Wei, J. N., Duvenaud, D. & Aspuru-Guzik, A. Neural networks for the

prediction of organic chemistry reactions. ACS Cent. Sci. 2, 725–732 (2016).

[7]Sandfort, F., Strieth-Kalthoff, F., Khnemund, M., Beecks, C. & Glorius, F. A

structure-based platform for predicting chemical reactivity. Chem 6,

1379–1390 (2020).

参考数据:

[1]https://figshare.com/articles/dataset/Chemical_reactions_from_US_patents_1976-Sep2016_/5104873

抖店动销抖店体验分提升抖店任何业务可添加微信:ad07668

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.zg8899.cn/18326.html