专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
目录
相关文章推荐
阿里开发者  ·  Spring容器的本质 ·  14 小时前  
阿里开发者  ·  微调碾压RAG?大模型意图识别工程化实践 ·  23 小时前  
海外独角兽  ·  扛住 DeepSeek 黑天鹅,AGIX ... ·  2 天前  
阿里开发者  ·  高并发编程知识体系 ·  2 天前  
51好读  ›  专栏  ›  3D视觉工坊

研二计算机视觉方向,没有idea也不会写代码,该怎么办?

3D视觉工坊  · 公众号  ·  · 2024-11-13 07:00

正文

点击上方“ 3D视觉工坊 ”,选择“星标”

干货第一时间送达

内容来自知乎,「3D视觉工坊」整理,如有侵权请联系删除 https://www.zhihu.com/question/596252794

碰上大雾天气,纯视觉方案是如何识别车辆和障碍物的呢?

作者 深度之眼-Lee

不得不说你们导师是真的不够称职。

首先要明确你这种交叉领域发论文是有两种方向,第一种叫做纵向,什么意思,就是你们导师要求的魔改网络。

比如说我发现我的YOLO在之前肺结节图片上去做检测,发现我检测的时候小的肺结节检测不到,发现问题了对吗?那么发现问题的时候你有两种方式,第一种我是想通过魔改我的网络的方式改变我的网络的结构,让我的微小的肺结节被检测到,这是其中的一个方向。我纵向的去做,去改变我的一个算法,发现问题解决问题。

这种就是看起来容易想到,但实现难度较大,尤其非科班出身的学员,算法能力拼不过CS的大佬。很难有效果。

第二个是什么?第二种就是我去做一个方案,横向去发论文,这是最常用,也是对硕士研究生来讲最好发论文的方向。

比如还是肺结节的问题,我可以通过改变我的网络的结构去做。那么也可以通过组成一个方案,什么意思,比如说我的大的肺结节可以通过yolo做,如果太小的话,我能不能自己设定一个流程,或者是我能不能使用多个开源数据集,因为有好多其他的开源数据集,它的数据可能微小的肺结节比我现在使用的开源数据集多,那么这样的话,它的数据量大,所以更容易让我获得微小肺结节的信息,那么这个时候它就是一个多元数据集,你在使用的时候就需要加算法B,加入进来了之后跟你原来的一个A结合,它就变成了你的一个解决方案的问题,也就是我们常说的,在你做应用问题的时候的一个方案类型的。

所以说通常来说,我们不光是医学图像,在做所有问题的时候都是样子的。

希望对研一研0正在摸索的同学有启发吧

作者 摸头鹰

描述中存在几个层次的问题。

从发论文的角度,单纯的图像分割在医学影像领域不是一个好的方向,毕竟这个方向已经很成熟了。看看近年的MICCAI,研究热点从全监督、半监督场景变到domain adaptation、label noise、annotation free、univseral organs等。想发文章得找一个合适的切入点,而不是泛泛地说自己做医学影像分割。

要克服对代码的恐惧。除了自己,没人会帮你写代码,研一学生就是课题组最底层的存在。而发论文来达到毕业要求,魔改代码的能力是必须的,要把自己的idea实施出来。没有idea,纯粹是相关论文读少了,陷到“闭门造车”的状态。拿到新的课题,







请到「今天看啥」查看全文


推荐文章
阿里开发者  ·  Spring容器的本质
14 小时前
阿里开发者  ·  微调碾压RAG?大模型意图识别工程化实践
23 小时前
阿里开发者  ·  高并发编程知识体系
2 天前
老子道德经  ·  珍惜吧,活着活着就老了
8 年前
格上财富  ·  川普墙设计方案,横空出世
8 年前
猎奇漫画部  ·  恐怖漫画丨报应
7 年前