본문 바로가기

ml

(4)
CVPR 2021 3D Pose Estimation Papers Review : 2D-to-3D Lifting 기법들의 향연.. 그리고 데이터 부족 문제를 해결하려고 노력하다 2D to 3D Lifting 기법이 대다수이다 (Graph SH, CanonPose, ContextPose) HPE는 크게 Human Pose & Shape Estimation (Mesh Estimation)과 Keypoint Estimation으로 나뉜다 Keypoint Estimation은 직접 RGB영상에서 3D Pose 정보를 추출하는 one stage 기법과 2D Pose 정보로부터 3D Pose 정보를 추출하는 two stage 기법으로 나뉜다 이번 CVPR 2021의 Keypoint Estimation 논문 중에는 2D-3D Pose Lifting 기법이 대다수였고, one-stage 기법은 거의 없던 것으로 확인했다 2D-3D Pose Lifting 기법은 onse stage 기법에 비해..
VNect: Real-time 3D Human Pose Estimation with a Single RGB Camera (SIGGRAPH 2017) 실시간성을 갖춘 3D Pose Estimation을 찾다가 baseline으로 가장 많이 인용된 논문 중 하나인 VNect를 읽어보았다. 실제로 사용을 해보니 공개 caffe 기반 모델이 있다는 점은 분명 장점이지만, 파이썬으로 구현된 공식open-source가 없다는 점, 공식 코드는 윈도우 기반에 C++ 기반이라는 등의 한계가 있다. 그래도 네이버에서 이걸 모바일화시킬 정도면 의미있는 모델인 거 같긴 한데, 3D Pose 초보인 내가 갖다 쓰기엔 영 불편한 면이 없지 않아 있다. 아무튼 논문의 동기, 구조 등을 확실히 잘 써놓은 훌륭한 논문이라고 생각이 든다. Intro - MS Kinect, AR/VR 같은 서비스들이 등장하면서 정확하면서 빠른 3D Pose Estimation 기술에 대한 니즈가 ..
Semantic Image Synthesis with Spatially-Adaptive Normalization (CVPR '19) 일명 SPADE라고 불리는 Pix2Pix SOTA 기법에 대한 논문이다. 이전에 리뷰했던 Pix2Pix 논문의 고도화 버전이며, NVIDIA의 논문에다가 저자들도 다소 겹치고, 1저자가 한국인이라는게 눈에 띈다. 주된 어플리케이션은 Semantic layout -> Photorealistic Image으로 변환하는 것이다. Semantic segmentation의 라벨만으로 그럴듯한 자연 영상을 생성해준다는 것으로 이해하면 쉽다. SPADE(Spatially-adaptive denormalization) 기존기법들은 semantic layout을 직접 입력으로 이용했는데, 이는 기존의 'normalization layer'에 의해 semantic information이 날라가기 때문에 suboptimal..
쉽게 알아보는 AWS Certified Machine Learning - Specialty 자격증 취득 후기! 작년 말 텐서플로우 개발자 자격증에 이어 역시 같은 머신 러닝 분야의 공인 시험인 AWS Certified Machine Learning 시험에 응시하게 되었다. 구글에도 ML 시험이 있지만, 아직 Beta 버전이라서 Examtopics에 문제도 없고 공부하기가 어려워 보였다. 그래서 주변에 취득한 사람이 있어 정보도 얻기 쉬운 AWS ML로 선택하여 시험에 응시하게 되었다. 결론부터 말하자면, 난이도는 GCP랑 비슷한 정도? 머신 러닝 기초 지식이 있냐 없냐에 따라 또 난이도가 많이 갈릴 시험이다. 1. 우선은 어떤 퍼블릭 클라우드 시험이 그러하듯 해당 시험 주체의 CSP사의 인프라에 대한 지식이 많이 필요하다. 나같은 경우에 예전에 이미 관련하여 교육을 몇번 수강했었고, 이번에도 시험 응시 전 우연히..