본문 바로가기
Technology/AI

AI의 과도한 경쟁

by UG0 2024. 7. 24.

이 글은 SEQUIA의 "AI Optimism vs. AI Arms Race"를 번역한 글입니다.

상상해 보세요. 만약 당신이 인공지능(AI)이 인터넷만큼 변혁적일 것이며, 당신이 세상에서 유일한 AI 회사를 운영하고 있다는 사실을 알고 있다고 가정해 봅시다. 당신은 얼마나 빠르게 자본 지출*을 구축하겠습니까?

자본 지출(Capital Expenditure, CapEx)

기업이 장기적인 자산을 구매하거나 유지보수하기 위해 사용하는 비용을 의미. 이러한 자산은 기업의 미래 수익 창출에 기여할 수 있는 자산으로, 건물, 기계, 장비, 차량, 또는 물리적 인프라 등이 포함된다.

1. 확장성 자본 지출
새로운 자산을 구입하거나 기존 자산의 능력을 확장하는 데 사용되는 비용. 예를 들어, 회사가 새로운 공장을 건설하거나 추가 생산 라인을 설치하는 경우가 이에 해당된다.

2. 유지보수 자본 지출
기존 자산을 유지보수하거나 업그레이드하는 데 사용되는 비용. 예를 들어, 기계나 장비의 수리를 위해 사용되는 비용이나 오래된 건물의 리노베이션 비용 등이 이에 해당된다.

저는 자본 지출을 천천히 할 것 같습니다. AI에서의 자본지출 즉 'AI CapEx'는 토지, 전력, 철강 및 산업 역량을 갖춘 물리적 데이터 센터를 구축하는 것을 의미합니다. 만약 당신의 회사가 유일한 AI 회사라면, AI 수익을 극대화할 시간을 가질 것입니다. 냉각 시스템이 어떻게 작동하는지 보고, 필요에 따라 데이터 센터 설계를 변경할 것입니다. 적절한 위치에 새로운 전력 생산 자산을 구축하고, 그런 다음 광섬유 케이블 근처에 데이터 센터를 지을 것입니다. 당신이 하지 않을 것은 여러 해 동안의 CapEx를 즉시 고정하는 것입니다. 왜냐하면 모델과 아키텍처가 변함에 따라 데이터 센터도 진화해야 한다는 것을 알기 때문입니다.

오늘날 많은 시장 참여자들은 AI의 엄청난 잠재력에 비추어 인프라 구축이 정당하다고 믿는 'AI 낙관론자(AI Optimism)'와 과도한 구축이 미래 기대를 너무 높게 만든다고 믿는 'AI 비관론자' 사이의 선택이 있다고 믿게 만듭니다. 위의 사고 실험은 이것이 잘못된 이분법임을 보여줍니다. CapEx 논쟁은 규모에 관한 논쟁이 아니라 속도에 관한 논쟁입니다.

사실, AI를 더 믿는다면 물리적 인프라가 AI 모델의 발전 속도를 따라가지 못해 구식이 될까 걱정할 수도 있습니다. 예를 들어, 모두가 100k 클러스터*를 갖추게 되면, 대형 기술 회사들은 50k 및 25k 클러스터로 무엇을 해야 할지 고민해야 할 것입니다. 일부 업계 전문가들은 다음과 같은 의견을 피력하기도 했습니다: 어떤 경계 모델도 동일한 데이터 센터에서 두 번 훈련하지 않을 것입니다. 모델이 훈련될 때쯤이면 GPU는 구식이 되고, 경계 클러스터 크기는 커질 것입니다. 또한 부동산 면적에 필요한 전력량과 GPU 랙을 얼마나 밀집하게 배치할지에 대한 문제가 있는데, 이는 GPU 전력 효율성에 따라 달라지는, 계속 변화하는 목표입니다.

컴퓨팅 클러스터(Computer Cluster)

여러 대의 컴퓨터(서버)들을 하나의 시스템처럼 연결하여 동작하게 만든 집합체. 클러스터는 주로 데이터 센터에서 사용되며, 큰 계산 작업이나 데이터 처리 작업을 분산하여 처리할 수 있게 해준다.

1. 병렬 처리
여러 대의 서버가 동시에 작업을 수행할 수 있어, 대량의 데이터나 복잡한 계산 작업을 빠르게 처리할 수 있다.

2. 확장성
클러스터에 서버를 추가함으로써 쉽게 용량을 확장할 수 있다. AI 모델 훈련과 같이 큰 연산 자원이 필요한 작업에 유리하다.

3. 고가용성
클러스터 구성 요소 중 일부에 문제가 생겨도, 나머지 서버가 작업을 계속 수행할 수 있어 안정성을 높인다.

4. 분산 컴퓨팅
클러스터는 데이터를 분산 처리함으로써 처리 속도를 높이고, 단일 서버에서 처리할 수 없는 작업도 가능하게 만든다.

AI 분야에서는 클러스터를 사용하여 대규모 모델을 훈련하거나, 데이터 분석 및 처리 작업을 수행합니다. 위 글에서는 이러한 클러스터의 수량과 크기가 중요한 이유로, 빠르게 진화하는 AI 기술에 발맞춰야 하기 때문에 기존 클러스터가 빠르게 구식이 될 수 있다는 점을 강조하고 있습니다.

오늘날의 인프라 구축 속도를 이해하기 위한 핵심은 AI에 대한 낙관론이 AI CapEx의 추진력 중 하나라는 점을 인식하는 것입니다. 그러나 이것만이 전부는 아닙니다. 클라우드 사업자들은 치열한 경쟁이 있는 무자비한 과점 시장에 존재합니다. 현재 클라우드 사업은 전체 SaaS 부문과 합쳐서 대략 $250B 규모로, 결코 작은 시장이 아닙니다. 클라우드 거대 기업들은 AI를 위협이자 기회로 보고 있으며, 기술이 어떻게 발전할지 기다릴 여유가 없습니다. 그들은 지금 행동해야 합니다.

마이크로소프트, 아마존, 구글 간의 경쟁은 게임 이론적입니다. 마이크로소프트가 상황을 악화시킬 때마다 아마존은 따라잡기 위해 악화시킬 동기가 생깁니다. 그리고 반대도 마찬가지입니다. 우리는 이제 역사상 가장 큰 세 회사 간의 경쟁적 악화 주기에 있으며, 이들 모두의 총 가치는 $7T 이상입니다. 악화 주기의 각 단계에서 쉽게 정당화될 수 있습니다. "우리에겐 이를 감당할 충분한 돈이 있습니다." 더 많은 헌신이 더 많은 자신감을 불러일으키고, 이 순환이 자가 강화됩니다. 공급 제한이 이 동적을 터보 충전합니다: 지금 토지, 전력, 노동을 확보하지 않으면, 다른 누군가가 그 자리를 차지할 것입니다.

작은 회사들에게는 그 긴급성이 더욱 큽니다. 만약 마이크로소프트와 아마존이 모든 토지와 전력, 디젤 발전기, 액체 냉각 시스템을 다 사들인다면, 당신은 어떻게 경쟁하겠습니까? 아마존, 구글, 마이크로소프트의 규모보다 한 단계 아래를 보면, 절박감이 느껴집니다. 지금 움직이지 않으면, 다시는 기회가 없을 것입니다.

이것은 우리가 클라우드 제공업체의 공격적인 행동에서 볼 수 있는 또 다른 잠재적인 동기를 설명하는 데 도움이 됩니다: 방어입니다. 이제 대규모 비용 감당 능력을 가진 회사들만이 AI 인프라 경쟁에 참여할 여유가 있습니다. 이런 관점에서, 과도한 구축은 완전히 합리적일 수 있습니다.

낙관적 이유든 경쟁적 이유든 간에, 오늘날의 새로운 AI 데이터 센터의 빠른 건설은 앞으로 스타트업에 큰 긍정적인 영향을 미칠 것입니다. 오늘날 AI에서의 많은 위험을 인프라 제공업체가 떠안고 있습니다. 이는 그 위에 구축되는 스타트업들에게 사실상 보조금 역할을 합니다. 마이크로소프트, 아마존, 구글 간의 경쟁은 미래의 API 가격 인하를 보장할 것입니다. 이는 또한 AI 생태계에도 좋습니다. 이 CapEx 투자들은 우리에게 스케일링 법칙을 테스트하고 AI의 미래 잠재력에 대해 더 많이 배울 수 있게 해 줄 것입니다.

과거 정부들이 했던 것처럼, 대형 기술 기업들은 혁신을 촉진할 고비용 선행 인프라 투자를 하고 있습니다. 이러한 투자가 감가상각되기 전에 수익을 낼지 여부에 상관없이, 이들은 AI의 장기적 영향에 중요한 경로에 있습니다.

'Technology > AI' 카테고리의 다른 글

노벨 물리학 상에 침투한 AI  (1) 2024.10.15
800조 짜리 AI의 질문  (0) 2024.07.25
AI 에이전트와 Langchain  (6) 2024.07.23
AI는 버블인가?  (1) 2024.06.05
생성형 AI가 UI/UX디자인을 다시 만드는 방법  (0) 2024.05.19