导读当前大多数都使用相机检测来调整照片处理参数和相机设置。然而,没有可用的公共数据集和模型可用于此任务,每个制造商都设计了
当前大多数智能都使用相机场景检测来调整照片处理参数和相机设置。然而,没有可用的公共数据集和模型可用于此任务,每个制造商都设计了自己的有限解决方案。最近,苏黎世联邦理工学院的研究人员提出了一种用于场景检测的新型大规模数据集。
它包含超过 11,000 张图像和 30 个场景类别。为该任务提出了几种有效的模型。达到94%以上的率。对在野外的智能手机上提出的解决方案进行了彻底评估。经证实,所建议的方法在现代设备上的运行速度足够快。
该模型在各种场景、条件和环境中具有表现力和鲁棒性。数据集和设计的模型现已公开可用,以便为此任务建立有效的基线解决方案。
人工智能驱动的自动相机场景检测模式现在几乎可以在任何现代智能手机中使用,尽管准确的场景预测问题尚未得到研究界的解决。本文首次仔细定义了这个问题,并提出了一种新颖的相机场景检测数据集(CamSDD),其中包含超过 11K 幅手动抓取的属于 30 个不同场景类别的图像。我们为此任务提出了一种高效且对 NPU 友好的 CNN 模型,该模型在该数据集上的前 3 名准确率为 99.5%,并在最近的移动 SoC 上实现了超过 200 FPS。对获得的解决方案进行额外的野外评估,以分析其在现实世界场景中的性能和局限性。本文中使用的数据集和预训练模型可在项目网站。