본문 바로가기

chatgpt 기술탐구

천재해커 조지 하츠 인터뷰

반응형

읽다보면 지식이 늘어나는 기분이 드네요

유튜브 보는것도 좋고 , 아래 어떤분이.해석해주셨는데 읽어보는것도 도움이 되실듯합니다

자율주행과 , Ai의 발전속도가 생각보다 엄쳥 빠른것 같네요

무섭기도하지만, 그만큼 기대도 많이 됩니다.

ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ


펌🦋조지 하츠 인터뷰 번역편 1

2007년, 겨우 17살이라는 나이에 아이폰을 jailbreak해서 명성을 얻은 천재해커 조지 하츠. 그는 자율주행에 대해서 어떤 생각을 갖고 있을까? 왜 AI 슈퍼지능으로 인한 종말이 일어나면, AI도 같이 죽을 것이라고 생각할까?

테슬라와 자율주행:

렉스: 오픈 파일럿에 대해 언급했으니 첫 번째 회사인 Comma.ai에 대해서 말해보자고. 반자율주행 개발은 어떻게 진행되고 있어?

하츠: [씨익 웃으며] 그게 말이지… 더 이상 FSD에 대해 이야기하는 사람은 거의 없고, 오픈 파일럿에 대해 이야기하는 사람은 더 적다는 사실을 알아챘어? 우리는 문제를 해결했어. 몇 년 전에 해결했지 사실.

렉스: 정확히 무엇이 문제였지? 해결했다는 게 무슨 뜻이야?

하츠: 해결이란 “운전에 대한 인간의 정책을 출력하는 모델을 구축”하는 것이야. 즉 합리적인 센서 세트가 주어지면 운전에 대한 인간 정책을 출력하는 모델을 어떻게 구축할 수 있을까?

웨이모나 크루즈와 같은 회사는 많은 것을 직접 코딩하고 있지. 이건 “준 인간 정책”이라고 할 수 있어. 하지만 인간 정책을 데이터만을 통해서 학습하는 회사는 Tesla와 더 나아가서는 콤마(Comma)가 있어.

지금 우리가 하고 있는 큰 일을 트위터에 공개했어. 코마가 처음 만들어졌을 때 우리는 “Learning a driving simulator,”이라는 논문을 발표했지. 이 논문의 핵심은 자동 인코더와 중간에 RNN을 사용하는 거야. 오토 인코더로 사진을 찍고, 압축하고, RNN을 사용하고, 다음 상태를 예측하는 방식이지. 이런 것들은 결국에는 웃음거리가 되는 나쁜 시뮬레이터였어. 2015년의 머신러닝 기술이니까. 오늘은 VQ-VAE와 트랜스포머가 있어. 그러니까 드라이브 GPT를 구축하고 있다는 거지.

렉스: 하하, 드라이브 GPT라, 알겠어. 그럼 어떻게 훈련을 시키지? 자체 감독 방식으로 학습돼?

하츠: 그럼. 다음 프레임을 예측하기 위해 모든 주행 데이터를 학습해.

렉스: 그게 사람의 정책을 학습하려고 한다는 거지? 사람이라면 어떻게 하는지?

하츠: 음… 그것보다. 사실 우리 시뮬레이터는 포즈(pose)에 맞춰져 있어. 그러니까 사실상 시뮬레이터야. State action pair를 입력하면 다음 상태를 예측할 수 있는거지. 그런 다음 시뮬레이터가 있으면 시뮬레이터에서 RL [Reinforcement Learning]을 수행하고 RL이 인간 정책을 얻을 수 있어.

렉스: 트랜스퍼가 된다는 뜻이군

하츠: 그렇지, 보상 기능이 있는 RL. 단순히 인간 정책이 무엇인지를 묻는 다기보다 이 행동을 했을 때 인간이 해제를 [disengage] 할지 말지를 묻는 거지.

렉스: 좋아, 그 차이점에 대해 생각해 볼께. 사람이 연결을 해제할까? 해제할까…? 그것은 인간 정책과 관련이 있다고 생각하지만 다를 수도… 그러니까 "인간이라면 어떻게 할 것인가?"라고 묻는 것이 아니고. "훌륭한 인간 운전자라면 어떻게 할 것인가?"라고 묻는 거겠지. (하츠가 고개를 끄덕인다.) 그리고 그 경험은 편안하면서도 너무 조심스러워서 짜증나지 않기도 하고. 흥미롭고 좋은 질문이네.

하츠: 이게 진짜 정확하고 핵심을 찌르는 질문이야. “무엇이 고객을 행복하게 만들까?” 절대로 이탈하고 싶지 않은 시스템이지.

렉스: 일반적으로 고객의 이탈은 거의 항상 "시스템이 하는 일에 만족하지 않는다"는 신호이기 때문이겠지.

하츠: 대부분 그렇지. 근데 가끔씩 그냥 운전하고 싶을 때도 있어. 그것도 괜찮지만 데이터에는 노이즈처럼 보일 뿐이야.

렉스: 하지만 난 그냥 운전하는 싶어, 이것도… [불만족의 사인이 아닐까?]

하츠: 맞아! [어쩌면 그럴수도 있다는 표정].

렉스: 왜 운전하고 싶은 기분이 들까? 운전수와 자동차의 관계를 재조정해야 해야 될수도 있겠네. 정말 흥미롭군. 자율주행을 실현하는 데 얼마나 가까워졌을까?

하츠: 말하기 어려워. 아직 루프를 완전히 닫지 않았으니까. 그래서 아직 그런 아키텍처를 실제로 구현한 것은 아무것도 없어. 프로토타입이 있고 버그가 있지. 그래서 몇 가지 버그를 더 수정해야 돼. 1년이 걸릴 수도 있고 10년이 걸릴 수도 있어.

렉스: 어떤 버그를 말하는 거지? 철학적인 버그? 논리적인 버그? 어떤 종류의 버그를 말하는 거지?

하츠: 그냥 멍청한 버그 같은 거. 그리고 규모가 더 필요할 수도 있어. 방금 콤마에서 컴퓨팅 클러스터를 대규모로 확장했어. 이제 두 사람 분량의 컴퓨팅을 사용할 수 있어. 40 페타플롭스.

렉스: 풉. 근데 사람마다 다르지.

하츠: ㅋㅋㅋㅋ. 인간은 20페타플롭 정도 되겠지. 그냥 단위일 뿐이야. 말도 제각각 힘이 다르지만 우리는 여전히 마력이라고 부르잖아.

렉스: 그렇지만 모빌리티와… 매우 복잡한 세상에서 존재하는 지각과 행동과는 다른 무언가가 있잖아.

하츠: 당연하지. 그리고 물론 모든 플롭이 평등하게 창조된 것은 아니지. 가중치가 무작위로 초기화되어 있다면...

렉스: ㅋㅋㅋㅋ 모든 플롭이 평등하게 창조된 것은 아니라…

하츠: 어떤 플롭은 다른 플롭보다 훨씬 더 유용한 일을 한다고.

렉스: 맞아. 아무튼, 확장이란 컴퓨팅을 의미하는 거야, 아니면 데이터의 규모를 얘기하는 거야?

하츠: 둘 다.

렉스: 데이터의 다양성도?

하츠: 데이터에서 다양성은 매우 중요해. 우리는 매일 5,000명 정도의 활성 사용자가 있는 것 같아.

렉스: [Tesla] FSD의 성과를 어떻게 평가하고 있어?

하츠: 꽤 잘하고 있지.

렉스: 이 경주는 누가 이기고 있는 거야?

하츠: 테슬라가 우리보다 1~2년 정도 앞서고 있어. 그들은 항상 우리보다 1~2년은 앞서 있었고, 앞으로도 그럴 거야. 왜냐하면 그들은 잘못한 것이 없기 때문이지.

렉스: 지난번에 이야기한 이후로 흥미로운 것을 본적이 있어? 아키텍처 결정, 배포 방식, 소프트웨어 측면에서 사용하는 아키텍처, 팀 운영 방식, 데이터 수집등 모든 종류의 것들 말이야.

하츠: 난 그들이 End-to-end 방식으로 나아가고 있다는 것을 알고 있지.

렉스: 모든 면에서 End-to-end 방식으로 나아가고 있다? 트레이닝, 정보 수집 전부 다?

하츠: 맞아. 그리고 그들은 좋은 시뮬레이터를 갖고 있어. 아마 우리와 똑같은 말을 하고 있을 거야. 아마 “우리가 최적화만 하면 될거야,” “리워드를 뭘 주지?” 해제 할 때마다 Negative reward를 주고, 이건 누구나 알고 있는 사실이야. 누가 실제로 구축하고 배포할 수 있느냐의 문제일 뿐이지.

(2편에서는 AI에 대한 그의 의견을 번역합니다)

출처:
youtube.com/watch?v=dNrTrx…

출처 https://twitter.com/ContrarianinKor/status/1685535946413142016?t=v7EeDwvuPMAl5JQr2b1p_A&s=19


320x100