研二计算机视觉方向，没有idea也不会写代码，该怎么办？

3D视觉工坊 · 公众号 · · 2024-11-13 07:00

正文

点击上方“ 3D视觉工坊 ”，选择“星标”

干货第一时间送达

内容来自知乎，「3D视觉工坊」整理，如有侵权请联系删除 https://www.zhihu.com/question/596252794

碰上大雾天气，纯视觉方案是如何识别车辆和障碍物的呢？

作者深度之眼-Lee

不得不说你们导师是真的不够称职。

首先要明确你这种交叉领域发论文是有两种方向，第一种叫做纵向，什么意思，就是你们导师要求的魔改网络。

比如说我发现我的YOLO在之前肺结节图片上去做检测，发现我检测的时候小的肺结节检测不到，发现问题了对吗？那么发现问题的时候你有两种方式，第一种我是想通过魔改我的网络的方式改变我的网络的结构，让我的微小的肺结节被检测到，这是其中的一个方向。我纵向的去做，去改变我的一个算法，发现问题解决问题。

这种就是看起来容易想到，但实现难度较大，尤其非科班出身的学员，算法能力拼不过CS的大佬。很难有效果。

第二个是什么？第二种就是我去做一个方案，横向去发论文，这是最常用，也是对硕士研究生来讲最好发论文的方向。

比如还是肺结节的问题，我可以通过改变我的网络的结构去做。那么也可以通过组成一个方案，什么意思，比如说我的大的肺结节可以通过yolo做，如果太小的话，我能不能自己设定一个流程，或者是我能不能使用多个开源数据集，因为有好多其他的开源数据集，它的数据可能微小的肺结节比我现在使用的开源数据集多，那么这样的话，它的数据量大，所以更容易让我获得微小肺结节的信息，那么这个时候它就是一个多元数据集，你在使用的时候就需要加算法B，加入进来了之后跟你原来的一个A结合，它就变成了你的一个解决方案的问题，也就是我们常说的，在你做应用问题的时候的一个方案类型的。

所以说通常来说，我们不光是医学图像，在做所有问题的时候都是样子的。

希望对研一研0正在摸索的同学有启发吧

作者摸头鹰

描述中存在几个层次的问题。

从发论文的角度，单纯的图像分割在医学影像领域不是一个好的方向，毕竟这个方向已经很成熟了。看看近年的MICCAI，研究热点从全监督、半监督场景变到domain adaptation、label noise、annotation free、univseral organs等。想发文章得找一个合适的切入点，而不是泛泛地说自己做医学影像分割。

要克服对代码的恐惧。除了自己，没人会帮你写代码，研一学生就是课题组最底层的存在。而发论文来达到毕业要求，魔改代码的能力是必须的，要把自己的idea实施出来。没有idea，纯粹是相关论文读少了，陷到“闭门造车”的状态。拿到新的课题，

研二计算机视觉方向，没有idea也不会写代码，该怎么办？

正文

作者 深度之眼-Lee

作者 摸头鹰

请到「今天看啥」查看全文

作者深度之眼-Lee

作者摸头鹰