본문 바로가기

분류 전체보기

(53)
내가 저장하고 쓰려고 만든 FFMPEG 명령어 모음 ffmpeg -i "videoFile.mp4" -i "audioFile.mp3" -shortest outPutFile.mp4 : 오디오랑 비디오 파일 합칠 때 길이가 다르다면. 그냥 짧은쪽에 맞춰서 끝부분 날릴 때 쓴다. 안 맞는데 인코딩하면 이미지가 깨지는 경우가 많이 발생함. https://superuser.com/questions/277642/how-to-merge-audio-and-video-file-in-ffmpeg ffmpeg -i Yoonho_org.mp4 -ss 2 -vf scale=450:450 -c:a copy -filter:v fps=25 Yoonho.mp4 : output은 원본의 2초부터 시작해서 해상도는 450x450이고, 오디오 코덱은 복사, fps는 25로 수정하여 인코딩 f..
LipSync3D: Data-Efficient Learning of Personalized 3D Talking Faces fromVideo using Pose and Lighting Normalization 요즘 눈여겨 보는 분야인 Talking Face Generation. 그리고 역시 컴비쪽 논문은 최신 CVPR 논문부터 찾게 된다. 그래서 발견한 보물같은 논문인 LipSync3D라는 논문에 대해 리뷰해보려고 한다. 저자(연구기관) : Avisek Lahiri 등 (Google Research / Indian Institute of Technology Kharagpur) 개요 : 오디오 데이터에 align된 3D 얼굴 랜드마크와 2D 텍스쳐를 생성하여 Talking Face 생성 1) 학습용 비디오로부터 오디오 채널을 추출한 후 frequency 도메인의 spectrogram(STFT)으로 변환 2) 학습용 비디오의 한 프레임을 reference 프레임으로 선택하고, reference coordinate..
Linux 터미널에서 유용한 커맨드들 (상시 업데이트) df : 리눅스 시스템의 용량을 확인하고 싶을 때 사용 ls : 경로 내 파일들을 listing - l, la 등을 이용해서 상세보기, 숨긴파일 보기 등도 가능 cd (change directory) : 경로 변경 - 'cd -' 를 이용하면 뒤로 가기가 가능 !! : 이전에 입려한 커맨드 불러오기 ctrl + k : 입력부 뒤의 텍스트를 제거 - ex) abcdefg (ctrl+k) abcd -> abcdefg ctrl + y : 제거한 텍스트 복원 ctrl + u : 입력부 앞의 텍스트를 제거 (무슨 이유인지 안되네..) ctrl + w : 한 단어씩 앞으로 제거 less +F : 파일을 끝에부터 열어줌 tail -f : 파일의 끝 부분 일부를 보여줌 reset : 터미널 reset
NVIDIA CUDA path 변경하는 방법 오픈 소스에 따라서 각기 다른 CUDA 버전을 요구할 때가 있는데, 그럴 때 필요한 CUDA 버전으로 path를 변경할 수 있는 방법. sudo rm /usr/local/cuda sudo ln -s /usr/local/cuda-1x.x /usr/local/cuda export CUDA_HOME=/usr/local/cuda-10.1 export PATH=${CUDA_HOME}/bin:$PATH export LD_LIBRARY_PATH=${CUDA_HOME}/lib64:$LD_LIBRARY_PATH
리눅스 GPU 프로세스 끄는 방법 싱글/멀티 GPU를 사용할 때 GPU 메모리가 이미 점유 중이라서 메모리 에러가 발생하는 경우가 있을 때 사용할 수 있는 방법들. sudo fuser -v /dev/nvidia* 를 통해 GPU를 점유 중인 프로세스를 찾고 해당 PID에 대해 (nvidia-smi를 통해서도 점유 프로세스에 대한 확인이 가능하다) sudo kill -9 출처 : https://askubuntu.com/questions/738631/how-can-i-free-my-gpu-memory-in-ubuntu-14-04
Git 자주 쓰는 커맨드 기존 git(origin)이 존재할 때 없애고 싶다면 : git remote rm origin 내가 원하는 깃랩의 origin 추가 : git remote add origin {remote git address} 깃에 올리고자하는 경로 또는 파일/폴더 추가 : git add . (or file/folder name) 커밋 : git commit -m "210902" -a 푸시 : git push origin(원격브랜치) master(로컬브랜치) 특정 브랜치 clone : git clone -b branchname gitname
CVPR 2021 3D Pose Estimation Papers Review : 2D-to-3D Lifting 기법들의 향연.. 그리고 데이터 부족 문제를 해결하려고 노력하다 2D to 3D Lifting 기법이 대다수이다 (Graph SH, CanonPose, ContextPose) HPE는 크게 Human Pose & Shape Estimation (Mesh Estimation)과 Keypoint Estimation으로 나뉜다 Keypoint Estimation은 직접 RGB영상에서 3D Pose 정보를 추출하는 one stage 기법과 2D Pose 정보로부터 3D Pose 정보를 추출하는 two stage 기법으로 나뉜다 이번 CVPR 2021의 Keypoint Estimation 논문 중에는 2D-3D Pose Lifting 기법이 대다수였고, one-stage 기법은 거의 없던 것으로 확인했다 2D-3D Pose Lifting 기법은 onse stage 기법에 비해..
VNect: Real-time 3D Human Pose Estimation with a Single RGB Camera (SIGGRAPH 2017) 실시간성을 갖춘 3D Pose Estimation을 찾다가 baseline으로 가장 많이 인용된 논문 중 하나인 VNect를 읽어보았다. 실제로 사용을 해보니 공개 caffe 기반 모델이 있다는 점은 분명 장점이지만, 파이썬으로 구현된 공식open-source가 없다는 점, 공식 코드는 윈도우 기반에 C++ 기반이라는 등의 한계가 있다. 그래도 네이버에서 이걸 모바일화시킬 정도면 의미있는 모델인 거 같긴 한데, 3D Pose 초보인 내가 갖다 쓰기엔 영 불편한 면이 없지 않아 있다. 아무튼 논문의 동기, 구조 등을 확실히 잘 써놓은 훌륭한 논문이라고 생각이 든다. Intro - MS Kinect, AR/VR 같은 서비스들이 등장하면서 정확하면서 빠른 3D Pose Estimation 기술에 대한 니즈가 ..