본문 바로가기

AI/AI읽어주는 남자

(6)
로봇에 집중하는 구글과 엔비디아 구글 딥마인드의 제미나이 로보틱스: 가장 발전된 VLAGemini Robotics Gemini Robotics deepmind.googleGemini Robotics: Bringing AI to the physical worldIntroducing Gemini Robotics and Gemini Robotics-ER, AI models designed for robots to understand, act and react to the physical world. Introducing Gemini Robotics and Gemini Robotics-ER, AI models designed for robots to understand, act and react to the physical wIntroduci..
Figure AI의 새로운 로봇을 위한 AI 모델 Helix https://www.figure.ai/news/helix Helix: A Vision-Language-Action Model for Generalist Humanoid ControlFigure was founded with the ambition to change the world.www.figure.ai Figure.ai는 2025년 2월 20일에 Helix라는 새로운 비전-언어-동작(VLA) 모델을 발표했습니다. Helix는 지각, 언어 이해, 학습된 제어를 통합하여 로봇 공학의 여러 오랜 과제를 해결하는 데 목적이 있습니다.Helix의 주요 특징은 다음과 같습니다:상체 전체 제어: Helix는 손목, 몸통, 머리, 개별 손가락을 포함한 인간형 로봇의 상체를 고속으로 연속 제어할 수 있는 최초의 V..
사티아 나델라 인터뷰: AI, 양자 컴퓨팅, 그리고 미래 기술 전망 최근 마이크로소프트(Microsoft) CEO 사티아 나델라가 AI와 양자 컴퓨팅, 그리고 미래 기술에 대한 깊이 있는 인터뷰를 진행했습니다. 그는 AI가 산업 전반에 미칠 영향, 기업 환경의 변화, 그리고 마이크로소프트가 준비하는 차세대 혁신 전략에 대해 이야기했습니다. 이번 포스팅에서는 인터뷰의 핵심 내용을 정리해 보겠습니다.https://www.youtube.com/watch?v=4GLSzuYXh6w 1. AI와 컴퓨팅의 미래: 인프라 변화의 시작나델라는 현재 AI 산업이 과거의 컴퓨팅 혁신과 유사한 흐름을 보이고 있다고 말합니다. 과거 RISC vs. CISC 논쟁, x86 서버의 발전, 그리고 클라우드 컴퓨팅의 등장이 산업을 바꾼 것처럼, 이제는 AI 인프라(컴퓨팅 파워, 저장소, 분산 컴퓨팅 ..
Large World Model의 대표 회사는 어디가 있을까? : Fei Fei Li 교수의 World Labs 그리고 Google DeepMind의 Genie2 지난번 포스팅에서는 NVIDIA의 LWM 기반의 Physical AI 플랫폼인 Cosmos에 대해 알아보았다. 오늘은 그 외에 또 어떤 유수의 회사들이 Large World Model을 위해 개발하고있는지 알아볼 것이다. World Labs를 설명하기 앞서, 창립자인 Fei Fei Li에 대해 간략히 설명하자면, 스탠포드 교수이자 ImageNet 프로젝트의 창시자로서 AI업계에서 이름을 떨쳤다. 그런 그녀가 2024년 4월 'Spatial Intelligence'를 표방하며 세운 회사가 바로 World Labs이다.https://www.worldlabs.ai/ World LabsWorld Labs is a spatial intelligence AI company building Large World Mo..
NVIDIA의 Large World Model, Cosmos의 등장 CES 2025에서 NVIDIA의 World 모델인 Cosmos가 등장했다.https://youtu.be/9Uch931cDx8 Physical AI라고 칭하는 이 모델은 현실세계의 물리법칙에 맞춰서 동작하는 합성 데이터를 생성할 수 있고,이러한 기술을 통해 로봇, 자율주행 등의 시뮬레이션에 유용할거라고 한다.실제로 Cosmos를 최초로 도입한 기업의 리스트에 우버, Figure AI, 애자일 로봇 등이 있다.https://blogs.nvidia.co.kr/blog/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development/ ‘NVIDIA Cosmos WFM 플랫폼’, 물리 AI의 세계로 안내하다 -..
아바타를 만드는 AI 기술 : Talking Face Generation 기술의 종류 5가지를 알아보자 AI아나운서, AI윤석열 등 AI를 이용하여 아바타를 만드는 기술에 대한 관심도가 최근에 부쩍 높아진 것을 느끼고 있는데요. 그래서 현재 연구개발분야이기도 한 AI 휴먼 생성 기술의 종류 중 하나인 Talking Face Generation가 무엇인지 그리고 기술의 종류를 어떻게 나눌 수 있을지에 대해 글을 한번써보려고 합니다. Talking Face Generation이란? 영상과 음성 등의 멀티모달 데이터를 입력으로 말하는 얼굴 동영상을 생성하는 기술로, 전처리로 여러가지 인식 기술도 필요하기 때문에 컴퓨터비전 분야와 음성/자연어 분야 등에 대한 폭넓은 이해가 필요한 기술입니다. 국내에서는 딥브레인, 마인즈랩 두곳이 상용화 서비스를 시작했고 그 품질 또한 상당히 훌륭합니다. 최근에 스마트테크코리아라는..