2.투자 프레임 및 실전 관찰

터보퀀트가 HBM 수요를 줄인다는 해석, 왜 틀렸는가

YK 인사이트 2026. 3. 27. 23:23

터보퀀트가 HBM 수요를 줄인다는 해석, 왜 틀렸는가(AI생성이미지)

구조가 바뀐 것이 아니라, 해석이 흔들린 것이다.


최근 시장에서 반복되는 말이 있습니다.

"AI 끝난 거 아니냐."
"반도체 이제 꺾인 거 아니냐."

구글 리서치가 터보퀀트를 발표한 이후, 마이크론은 약 7% 안팎 급락했고 삼성전자와 SK하이닉스도 하루 만에 4~6%대 하락을 기록했습니다. 초기 반응은 빠르게 하나의 결론으로 수렴했습니다.

"AI가 메모리를 덜 써도 되는 구조가 된다. HBM 수요가 줄어든다. 반도체 사이클이 꺾인다."

이 글은 주가 하락 자체보다, 그 뒤에서 시장이 어떻게 구조를 오해했는지를 짚어보려는 기록입니다.


터보퀀트는 무엇인가

터보퀀트는 구글 리서치가 3월 말 공개한 KV 캐시 압축 알고리즘입니다. 별도의 재학습 없이도 이미 학습된 AI 모델에 바로 적용할 수 있으며, 추론 과정의 KV 캐시 메모리 사용량을 약 6배 줄이면서 어텐션 연산 기준으로 처리 속도를 최대 8배까지 높입니다. 정확도 손실은 없습니다.

이것만 보면 시장의 반응이 이해됩니다. "메모리를 6배 줄인다"는 말이 곧장 "반도체 수요가 줄어든다"로 연결된 것입니다.

그런데 여기서 핵심적인 구분 하나가 빠져 있습니다.


시장이 놓친 메모리의 위계

AI 반도체, 특히 HBM이라고 불리는 고대역폭 메모리는 크게 두 가지 용도로 쓰입니다.

하나는 모델 자체를 담는 메모리입니다. GPT나 제미나이 같은 모델의 수백억 개 파라미터, 즉 모델의 두뇌 자체를 저장하는 공간입니다. 학습 과정에서도 이 메모리가 핵심으로 사용됩니다.

다른 하나는 대화를 처리하는 과정에서 잠깐 쓰이는 임시 메모리입니다. 사용자가 질문을 던지면 AI가 맥락을 기억하며 답변을 생성하는데, 이때 사용하는 작업 공간이 KV 캐시입니다. 대화가 끝나면 사라지는 일종의 단기 기억입니다.

터보퀀트가 줄이는 것은 오직 후자입니다. 모델 가중치를 담는 HBM, 그리고 학습에 사용되는 메모리에는 전혀 영향을 주지 않습니다.

모건스탠리는 이 점을 명확히 짚었습니다. 터보퀀트는 총 하드웨어를 6분의 1로 줄이는 기술이 아니라, GPU 한 대가 처리할 수 있는 작업량을 늘려주는 효율 개선에 가깝다는 것입니다. GPU와 TPU 위에 상주하는 모델 가중치나 학습용 메모리에는 영향을 주지 않는다고도 명시했습니다.

시장은 "메모리를 줄인다"는 말을 들었고, HBM 수요 전체가 줄어드는 것으로 해석했습니다. 하지만 터보퀀트가 건드리는 영역과 HBM 수요의 핵심 영역은 애초에 다른 곳에 있습니다.


효율이 오르면 수요는 어떻게 되는가

그렇다면 KV 캐시 효율이 오르면, 추론 쪽 메모리 수요는 줄어드는 것일까요.

경제학에는 효율이 오르면 오히려 사용량이 폭발하는 현상을 설명하는 개념이 있습니다. '제본스의 역설'입니다. 그리고 현실은 대부분 이 방향으로 움직여 왔습니다.

인터넷 속도가 빨라졌다고 데이터 사용량이 줄어든 적은 없습니다. 스마트폰 성능이 좋아졌다고 사용 시간이 줄어든 적도 없습니다. 효율이 오르면 비용 장벽이 낮아지고, 그 결과 더 많은 사람이 더 자주 사용하기 시작합니다.

데이터센터 입장에서 보면, KV 캐시 효율 개선은 토큰당 처리 비용을 낮춥니다. '한 번 써볼까'가 '계속 돌려도 되겠다'로 바뀌는 변수입니다. 더 긴 맥락, 더 복잡한 요청, 더 많은 동시 사용자를 같은 비용으로 처리할 수 있게 되면, AI 서비스의 사용 문턱이 낮아지고 수요는 오히려 더 빠르게 늘어납니다.

터보퀀트 프로젝트에 참여한 KAIST의 한인수 교수도 이 기술이 메모리 수요를 약화시키는 것이 아니라 AI 운영 효율을 높이는 핵심 기술로 쓰일 것이라는 취지로 설명했습니다. 국내 증권사들도 대체로 효율 개선이 오히려 메모리 인프라 수요를 자극하는 방향이라고 해석하고 있습니다.


그렇다면 이번 하락은 무엇인가

구조가 바뀐 것이 아닙니다. 해석이 흔들린 것입니다.

이번 하락은 펀더멘털이 아니라 인식이 과도하게 앞서 움직인 결과에 가깝습니다. 시장은 "어느 층의 메모리인가"를 묻지 않은 채 결론을 냈고, 그 해석이 주가를 구조보다 빠르게 움직였습니다.

외국인이 대형주 비중을 줄이고 있지만, 이것은 AI 투자 구조 자체가 꺾였다는 신호라기보다는 불확실성 구간에서 나타나는 포지션 조정에 가깝습니다.

구조가 무너지는 하락과 해석이 흔들리는 하락은 다릅니다. 지금은 후자입니다.

중요한 질문은 "AI가 끝났는가"가 아닙니다. "이 기술이 실제로 HBM 수요 구조를 바꾸는가"입니다. 지금까지의 논리를 따라가면, 그 답은 아직 그렇지 않다는 쪽에 가깝습니다.

시장이 구분하지 못한 것을 구분할 수 있을 때, 판단의 기준이 생깁니다.


※ 이 글은 특정 종목의 매수·매도를 권유하지 않으며, 시장 구조에 대한 관찰과 해석을 기록한 것입니다. 투자 판단과 그에 따른 결과는 전적으로 독자 본인의 책임입니다.