运行稳定 1794-IT8 指令功能强大
1756-A10 1756-A13 1756-A17 1756-A4 1756-A7 1756-BA1 1756-BA2 1756-BATA | 1756-IF16 1756-IF16H 1756-IF8 1756-IF8H 1756-IF8I 1756-IF6I 1756-IF6CIS 1756-IT6I
| 1794-IM16 1794-IM8 1794-IR8 1794-IRT8 1794-IT8 1794-IV16 1794-IV32 1794-OA16
| 1756-HSC 1756-IA16 1756-IA16I 1756-IA32 1756-IB16 1756-IB16D 1756-IB16I 1756-IB32
|
1756-CN2 1756-CN2R 1756-CNB 1756-CNBR 1756-DHRIO 1756-DNB 1756-EN2T 1756-EN2TR 1756-EN3TR 1756-ENBT 1756-ENET 1756-EWEB | 1756-IR6I 1756-IR12 1756-IRT8I 1756-IT6I2 1756-IM16 1756-L61 1756-L62 1756-L63 1756-L64 1756-L65 1756-L71 1756-L71S
| 1756-M03SE 1756-M08SE 1756-M16SE 1756-N2 1756-OA16 1756-OA16I 1756-OB16D 1756-OB16E 1756-OB16I 1756-OB32 1756-OF4 1756-OF8
| 1756-BATA 1756-CNB 1756-IC16 1756-IB16 1756-IB32 1756-IF16 1756-IR61 1734-ACNR 1734-ADN 1734-AENT 1734-AENTR 1734-APB
|
1756-TBS6H 1756-TBSH 1757-SRM 1746-N2 1746-NI16I 1746-NI4
| 1756-PA75R 1756-PB72 1756-PB75 1756-RM 1756-IB16 1746-IV32
| 1756-OF8I 1756-OW16I 1756-PA72 1756-PA75 1794-OA8 1794-OA8I
| 1746-IA16 1746-IB16 1746-IB32 1746-IM16 1746-IO12DC 1746-ITB16 |
运行稳定 1794-IT8 指令功能强大
“得益于大语言模型推动人工智能发展,图形图像学的研究和应用迎来新的机遇,正在推动大语言模型向大视觉模型发展。”2023年12月30日,在辞旧迎新之际,中国工程院院士、机器人视觉感知与控制技术国家工程研究中心主任王耀南在第十九届中国图象图形学学会青年科学家会议上,分享机器视觉智能化发展的新趋势。
在接受南都记者专访时,王耀南表示,人工智能让机器视觉走向智能化,更高的算力能够支撑大视觉模型的训练。不过,更聪明的大视觉模型还需要更高的算力水平、更好的模型架构和更有效的学习算法。
本次会议由中国图象图形学学会主办,琶洲实验室、华南理工大学、中山大学、中国图象图形学学会青年工作委员会承办。
谈行业趋势
从视觉计算走向视觉智能
王耀南:我国的机器视觉研究已有接近40年的历史,初是从传感器的研究开始的,即:将光的信息转化成图片信息。接下来要做的是视觉的处理,包括将获得的图片增强,使其变得更清晰。
有了清晰的图像后,我们需要从图片中获取我们感兴趣的目标。例如,在无人驾驶领域,机器视觉需要对图片中的目标进行检测,要回答哪些是人、哪些是车的问题。
这就是我们所说的机器视觉的三大领域。我把它归结为:成像、处理和理解。
机器视觉已经从过去的视觉计算走向了的视觉智能。视觉计算结合人工智能后,认知水平得到了提升,增强了对复杂环境的理解能力,整个视觉智能化行业在去年得到了快速发展。
机器视觉智能化发展的方向是进行广泛应用,应用到工业检测、智能制造以及卫星遥感等领域。
谈机器视觉,一定要谈它的应用,应用驱动技术发展。中国图象图形学学会有30个专委会,主要围绕图形图像展开研究,为国民经济服务。这些技术的应用场景十分广泛,包括工业、农业、地理信息系统、遥感、国土资源等。
一个人一出生就能看到这个世界,之后理解这个世界,80%的信息靠视觉获取。机器视觉是要模拟人的眼睛,终达到人眼的水平,并在部分方面超过人眼,要看得更远、看得更清。
谈大视觉模型
大视觉模型会越来越聪明
王耀南:大语言模型是用书本上、语言上、文字上的知识作为数据,进行训练的神经网络模型,能够根据它所学的知识进行推理和回答,是一种数据驱动的人工智能。
大视觉模型的数据则主要来自各种图像,包括人类和自然界产生的视觉数据。例如,医学大视觉模型就是将人的器官、病变的图像等作为视觉数据输入到大模型中,进行训练得到,可以像大夫一样看懂CT照片,能够达到病人来看病后,拍照完便能推理出病人病情的效果。
当前的视觉大模型并没有大家想象的和人脑一样,差距还很大。随着学习的数据的增多、模型参数的调整,模型会越来越大、知识也会越来越多,其智能水平就会越来越高,越来越聪明。
我们需要提高算力水平,加快计算速度,以能够更快地建立模型;设计更好的模型架构,包括可解释性更强、更安全可控;还需要研究更有效的学习算法。
事实上,视觉大模型并不是这几年才有的,是一步一步发展过来的。在上世纪80年代,随着人工智能的发展,人们开始研究神经网络的时候,就已经有了。只是,近几年的算力和算法能力提高了,人们可以尝试构建大模型,产生了大语言模型和大视觉模型。过去算力不够的时候,大家做的模型没有那么大。
运行稳定 1794-IT8 指令功能强大