Presenters


Dr. 김익재


2020-현재: KIST AI로봇연구소 소장

2020-현재: 고려대/연세대, Adjunct Professor

2009-현재: UST, Associate Professor

2017-2020: KIST, 영상미디어연구단 단장

1998-2017: KIST, Principal Research Scientist

2009-2010: MIT Media Lab., Postdoc

2009: 서울대, Ph.D.

실종아동등 신원확인을 위한 복합인지기술


Dr. 강성호


1994-현재: 연세대, Professor

2008-2010: 한국반도체테스트학회 회장

1992-1994: Motorola Inc., Senior Staff Engineer

1989-1992: Shulumberger Inc., Research Scientist

1992: The University of Texas at Austin, Ph.D.

현장출동 요원의 사용성을 고려한 시민안전 지킴이 디바이스 개발


실종아동 또는 치매노인 등의 신원확인 정보 및 다양한 치안 정보를 처리하기 위해, 신원확인 add-on 모듈, 신원정보처리용 디바이스플랫폼, 지문확인을 위한 확장형 add-on 모듈로 구성된  현장요원용 디바이스 개발  과정과 사용 효율성 향상과 저전력화를 고려한 연구 결과를 소개한다.

김덕수 상무


2016-현재: SQISOFT 상무

2006-현재: 민간/공공 SI 프로젝트 수행책임

1982-1995: 공군 소령 예편

실종아동등 복합인지 실종대응 플랫폼 및 실증 시범서비스 개발


실종아동등 신원확인을 위한 복합인지 기술이 적용된 실종대응 통합플랫폼을 개발하고 실증랩을 통한 실 치안환경에 시범적용 및 검증함으로써 현장에서 신속한 실종대응력을 높이기 위한 실종대응 통합플랫폼 및 신원확인 등의 응용서비스 개발 과정을 소개한다.

Dr. 박성주


KETI 정보미디어연구 센터장

KETI 재난안전 ICT 사업단장

TTA 공공기관용 CCTV 보안성능품질인증위원회 위원

행정안전부 재난안전 R&D 자문단 위원

KEIT 재난안전전문가포럼 위원

지능형 영상보안시스템 상호연동 표준기술 개발동향


이번 강연에서는 지능형 영상보안 분야를 중심으로, 사회문제해결을 목표로 추진되고 있는 연구개발 과제에 대해 확인해보고, 

영상보안시스템의 국내외 표준화 동향, 특히 영상보안시스템 상호연동 표준 기술 개발 동향에 대해 발표하고자 한다.

Dr. 김건우


2000-현재: ETRI 사이버보안연구본부 책임연구원

2017-현재: UST, Associate Professor

범죄 징후감지 기술동향 및 연구내용


지금까지 실시간 위험을 감지, 대응하기 위한 지능형 CCTV 기술에 대한 많은 연구가 진행되었고 일부 기술은 이미 지자체 CCTV통합관제센터 등에 적용되고 있다. 본 발표에서는 이러한 위험 사후대응을 넘어 위험 징후를 사전에 감지하고 예측하는 예측 치안(Predictive Policing) 패러다임으로의 변화를 살펴보고 국내 연구개발 현황에 대해서 얘기하고자 한다.

Dr. 김현우


2019-현재: 고려대, Assistant Professor

2017-2019: Amazon Lab126, Applied Scientist

2017: University of Wisconsin-Madison, Ph.D.

초거대 인공지능 모델과 고수준 장면이해


본 강연에서는 영상속 상황인식을 위한 다양한 고수준 장면이해 기법을 소개한다. 구체적인 태스크로는 장면그래프 생성 및 사람 사물 상호작용 탐지 기법을 소개하며, 초거대 인공지능 모델을 활용하여  해당 태스크를 향상시키는 방안에 대하여 논의한다. 또한 추가적으로 2D 영상 인식을 넘어 3D 영상을  위한 데이터 증강기법 및 새로운 네트워크 구조를 소개한다. 

Dr. 주재걸


2019-현재: KAIST, Associate Professor

2015-2019: 고려대, Assistant Professor

2011-2014: Georgia Institute of Technology, Research Scientist

2013: Georgia Institute of Technology, Ph.D.

Improving 3D-aware Image Synthesis by Leveraging Multi-modal Representations from CLIP


In this talk, I will present two pieces of my recent research, which improves 3D-aware image synthesis techniques by leveraging the knowledge of pretrained multimodal embedding model called CLIP. In the first part of the talk, I will introduce a novel approach for text-driven 3D-aware image editing that applies the editing to the local relevant regions by leveraging the pseudo mask information computed from the CLIP model. In the second part, I will introduce FaceCLIPNeRF, which can edit given facial images as well as perform its novel-view synthesis. Finally, I will conclude the talk by discussing future research directions.

Dr. 문경식


2021-현재: Meta Reality Labs

2021: 서울대, Ph.D.

2020: Google Ph.D. Fellowship

Understanding Humans in the 3D Space


Humans are the central focus in multimedia, such as video games, movies, and social media videos. AI systems capable of generating virtual 3D humans in such multimedia can provide significantly more immersive experiences. This presentation will introduce three breakthroughs to understand humans in the 3D space, mainly focusing on two interacting hands.

안병주


2023-현재: Apple Machine Learning Research

2017-2023: Carnegie Mellon University, Ph.D.

2014-2017: KIST, Research Scientist

2014: 서울대, M.S.

Full-surround 3D Reconstruction from Reflections


3D scanning of a single view of an object seldom suffices. Be it for 3D printing, augmented reality, or virtual reality, scanning of the shape of the entire object in all its complexity-what we refer to as "full-surround 3D"-is critical to have a faithful digital twin. In this talk, I will present a full-surround 3D imaging system that incorporates multiple mirrors to exploit inter-reflections. This system, when paired with structured light or neural rendering, enables us to reconstruct, with high accuracy and full coverage, highly complex objects that have intricate geometric features, including concavities and self-occlusions.

Dr. 김도엽


2019-현재: NVIDIA, Principal Researcher

2016-2019: Apple, Maps/Vision Pro, Senior ML Engineer

2015-2016: Uber, Maps Research, Senior Engineer

2013-2015: Microsoft, Maps, Senior Engineer

2011-2013: CMU / UC Berkeley, Postdoc

2010: 서울대, Ph.D.

Simulation AI-Machine Learning Approach for Solving Physics Problems


In this talk, I will introduce a general trend in machine learning (ML) for solving physics/simulation problems, especially within the computer graphics community. Since the rise of deep learning and AI, numerous approaches have emerged for fast, large-scale, and high-fidelity physics simulations. Recently, the field has been advancing at an even faster pace due to the power of new AI models, such as generative AI and neural representations. I will present and review some of the recent studies and then discuss how the intersection of ML and physics will evolve.

Dr. 김종유


2020-현재: Microsoft Research Asia, Senior Researcher

2018-2020: Microsoft Research Asia, Researcher

2018: 연세대, Ph.D.

Text-to-Image Generation Research and Application


최근 인공지능을 이용한 영상생성이 주목을 받고 있다. 특히, 디퓨전 모델을 이용한 텍스트 기반 영상 생성은 사용자에게 언어 기반 조작성을 제공하여 실제 다양한 산업에 적용될 수 있는 가능성을 주었다. 본 발표에서는 텍스트 기반 영상 생성 기술의 핵심 방법론을 설명하며 최근 연구 동향과, 산업에서 서비스되고 있는 사례를 살펴본다.

Dr. 허준화


2022-현재: Google

2015-2022: Technical University of Darmstadt, Ph.D.

2014-2015: KIST, Research Intern.

2013: 서울대, M.S.

Diffusion Model for Dense Vision Tasks


본 발표에선 이미지 생성모델로 널리 알려진 Diffusion model을 dense vision task에 적용할 수 있는 새로운 패러다임에 대해 소개합니다. Optical flow, monocular depth 및 semantic correspondence에 대한 적용을 통해 기존 domain knowledge를 활용하는 방법론과 비교 및 앞으로 나아갈 방향에 대해 소개합니다.

Dr. 민동보


2018-현재: 이화여대, Associate Professor

2015-2018: 충남대, Assistant Professor

2010-2015: Singapore Advanced Digital Sciences Center (ADSC), Research Scientist

2009-2010: Mitsubishi Electric Research Lab (MERL), Postdoc

2009: 연세대, Ph.D.

자기지도 학습: 기본 원리 및 최신 동향


자기지도 학습(Self-Supervised Learning: SSL)은 컴퓨터비전의 다양한 분야에 널리 활용되고 있다. 본 강연에서는 SSL 기반 사전학습(Pre-training)에 대한 기본 원리와 최신 동향에 대해 Contrastive learning과 Masked image modeling을 중심으로 살펴본다. 또한, 시각데이터를 위한 강화학습(Visual Reinforcement Learning)에 SSL을 적용하는 연구도 소개한다.

Dr. 김승룡


2020-현재: 고려대, Assistant Professor

2019-2020: EPFL, Postdoc

2018: 연세대, Ph.D.

Robust Text-to-3D Generation


Text를 입력으로 받아 3차원 모델을 만드는 기술은 최근에 Diffusion Model과 Neural Radiance Fields (NeRF)의 성공에 힘입어 실제적인 적용이 가능한 수준의 결과들이 공개되고 있다. 하지만 이러한 기존의 기술은 2차원 Diffusion Model에만 의존하다보니 생성된 3차원 모델이 View-inconsistent 한 결과를 자주 보여준다. 본 세미나에서는 이러한 View-inconsistency 문제를 해결하기 위한 연구들을 소개하고 향후 방향성에 대해서 논의해보고자 한다.

Program Committee


김건우 (ETRI)

김승룡 (고려대)

김승환 (ETRI)

김태훈 (딥핑소스)

김익재 (KIST)

김학섭 (KIST)

김현우 (고려대)

남기표 (KIST)

민동보 (이화여대)

박성주 (KETI)

박해솔 (KIST)

윤상민 (국민대)

정형주 (KIST)

조정현 (KIST)

주재걸 (KAIST)

최희승 (KIST)

홍유진 (호서대)

All rights reserved. Copyright ⓒ 2023 Visual Intelligence Group