SidePlay

AI 시대를 맞아 가장 각광받는 직업 중 하나로 꼽히는 개발자. 하지만 정작 개발자들은 ChatGPT, Claude와 같은 대형 언어 모델(LLM)을 통해 실제로 생산성 향상을 체감하고 있을까요? 많은 개발자들이 AI 도구로 생산성이 5~10배 증가했다고 주장하는 반면, 실제 소프트웨어 산업 전반의 생산성은 그만큼 증가하지 않은 것 같다는 주장도 존재합니다. 그럼 이러한 괴리는 어디서 오는 것일까요? 오늘은 LLM이 프로그래머의 실제 생산성에 미치는 영향과 그 한계에 대해 심층적으로 알아보겠습니다.

개발자들의 LLM 생산성 향상 주장: 과대평가일까?

최근 2년간 코딩 보조 AI 도구가 보편화되면서 많은 개발자들이 자신의 생산성이 5~10배 향상되었다고 주장합니다. 그러나 이 주장이 과연 현실을 반영하는 것일까요? 소프트웨어 업계 전체를 봤을 때 이러한 극적인 생산성 향상의 흔적은 찾기 어렵습니다. 만약 실제로 개발자들의 생산성이 그만큼 향상되었다면, 우리가 사용하는 소프트웨어에서 5~10배 많은 기능이 추가되거나, 소프트웨어 품질이 급격히 향상되었어야 하는데 그렇지는 않았거든요.

한 개발자의 경험에 따르면, LLM은 특정 상황에서만 생산성을 크게 향상시키며, 그 상황은 개발자 업무의 일부에 불과하다고 합니다. 예를 들어, 파일 조작을 위한 간단한 스크립트나 엑셀 VBA 코드와 같은 것을 작성할 때 LLM이 큰 도움이 되기는 할 것입니다. 또한 익숙하지 않은 기술 스택으로 작업할 때 LLM이 학습 과정을 크게 가속화할 수도 있을 것이고요.

하지만 이러한 사례가 대부분의 개발자에게 적용되는 것은 아닙니다. 실제 프로젝트에 LLM이 제공한 코드를 그대로 넣을 수 없는 경우가 많고, 보통 코드를 여러 모듈로 분리하고 객체 지향적으로 리팩토링해야 특정 프로젝트에 맞는 일관된 추상화를 사용할 수 있기 때문이지요.

LLM이 가장 효과적인 경우: 소규모 독립 스크립트 작성, 새로운 기술 스택 학습
LLM이 덜 효과적인 경우: 대규모 코드베이스, 복잡한 비즈니스 로직, 유지보수가 중요한 코드
생산성 향상 체감이 높은 사람들: 개발 경험이 적은 사람, 주로 소규모 스크립트를 작성하는 역할, 다양한 기술 스택을 다루는 직군

일부 대형 기술 기업에서 조사한 바에 따르면 AI 도구를 통해 문서 품질은 7.5%, 코드 리뷰 속도는 3.1% 향상되었지만, 배포 안정성은 오히려 7.2% 감소했습니다. 이는 AI 도구가 부정확하거나 불완전한 코드를 생성하여 프로덕션 오류 위험을 증가시키기 때문입니다.

LLM의 실질적인 생산성 향상 사례와 한계

LLM이 특정 영역에서 개발자들의 작업 방식을 크게 변화시켰다는 점은 단연코 긍정적인 부분이라고 할 수 있습니다. 실제로 테스트 작성, UI 프로토타이핑, 데이터 시각화, API 연동 코드 작성 등에서 개발자들은 상당한 시간을 절약하게 되었거든요. 특히 Python 테스트 작성에서는 이전에 실제 코드 작성보다 2배 이상 시간이 소요되었던 작업이 이제는 "이 함수에 대한 테스트를 작성해 줘"라는 간단한 프롬프트로 빠르게 처리될 수 있습니다.

또한 Cursor와 같은 AI 기반 코드 에디터를 사용하면 기본 코딩 속도가 40% 이상 향상될 수 있습니다. 이런 도구들은 개발자가 코드를 작은 논리적 청크(chunk)로 나누도록 유도하는 부수적인 이점도 있습니다. 예를 들어, 한 개발자는 약 14,000줄의 Python 코드로 구성된 중간 규모 프로젝트를 LLM의 도움으로 약 3일 만에 완성한 경우가 있었는데, 이는 LLM 없이는 최소 일주일, 아마도 한 달이 걸렸을 작업이었다고 합니다.

테스트 코드 작성: 기존 대비 2배 이상 시간 절약
간단한 코드 작업: 40% 이상 속도 향상
디버깅 및 데이터 분석: 일회용 시각화 도구 빠르게 생성
API 연동 코드: 원샷 솔루션 제공으로 시간 절약
UI 프로토타이핑: 여러 이해관계자를 위한 모형 빠르게 제작

그러나 LLM의 도움이 항상 생산성 향상으로 이어지는 것은 아닙니다. 많은 경우, LLM이 생성한 코드는 추가 작업이 필요하며, 때로는 코드를 이해하고 수정하는 데 더 많은 시간이 소요될 수 있습니다. 특히 대규모 코드베이스나 복잡한 비즈니스 로직이 있는 코드에서는 LLM의 효용성이 크게 떨어집니다.

연구에 따르면 LLM을 사용하면 버그 발생률이 41% 증가했으며, 번아웃 위험을 완화하지도 못했습니다. 심지어 많은 엔지니어들이 이러한 도구를 시도조차 하지 않는 것으로 나타났습니다. 실제 채택률은 예상보다 낮은데요, 약 30-40%의 엔지니어만이 이 제품을 사용해 본 것으로 나타났습니다.

LLM이 개발자 생산성에 미치는 실제 영향: 자기 착각일까?

흥미로운 점은 사람들이 자신의 생산성을 측정하는 데 매우 취약하다는 것입니다. 자동화된 방법을 사용하여 작업을 매우 빠르게 완료하면 본능적으로 좋게 느껴지고 눈에 잘 띄지만, 그 작업이 나중에 시간 비용을 발생시키는 경우 그 추가 비용을 이전에 설정한 "자동화된" 작업과 연결하지 못할 수도 있습니다.

이런 경우가 있었다고 하네요, 한 개발자가 자신이 AI 도구를 사용해 훨씬 생산적이 되었다고 강력하게 주장했지만, 실제로는 거의 완전히 신뢰할 수 없게 되었다는 것이죠. 당사자는 이를 부정하고 있지만, 몇몇 사람들은 그가 일으키는 모든 문제 때문에 워크플로우에서 그를 제외하려고 노력한다고 공개적으로 말했다고 합니다. 이는 마치 빠르게 성과를 내는 것과 품질 좋은 코드를 작성하는 것 사이의 균형이 무너진 것처럼 보이기도 합니다.

물론 LLM을 사용했기 때문에 시간을 낭비해야 했다는 것을 확실히 알기는 어렵습니다. LLM 코드가 스파게티처럼 꼬여있어서 다른 사람이 당신의 문제를 수정하는 데 얼마나 많은 시간을 낭비해야 했는지 모를 수도 있기 때문이죠.

생산성 측정의 함정: 빠른 완료는 쉽게 체감되지만, 품질 이슈는 나중에 드러남
가시성 문제: 초기 개발 속도 향상은 눈에 띄지만, 버그 수정과 유지보수 비용은 덜 가시적
통합 비용 간과: LLM 코드를 실제 프로젝트에 통합하는 시간 비용 무시
팀 내 부담 전가: 한 개발자의 AI 사용이 다른 팀원에게 더 많은 리뷰 부담 초래

많은 개발자들은 LLM을 주로 검색 엔진 대체재로 사용하곤 합니다. 요즘 검색 엔진은 이미 어떤 웹사이트에서 찾아야 할지 알고 있을 때만 정보를 잘 찾을 수 있기 때문이지요. 따라서 많은 경우 개발자들은 LLM을 통해 구문을 상기시키고, API에서 함수를 찾고, API를 이해하기 위해 가지고 놀 수 있는 코드 스니펫을 생성하는 대화형 문서로서 주로 활용하게 되는 것 입니다.

LLM의 개발자 생산성 향상: 현실과 미래

종합적으로 볼 때, LLM은 개발자의 생산성을 5~10배 향상시키지는 못하지만, 평균적으로 10~30% 정도의 전체적인 생산성 향상을 제공하는 것으로 보입니다. 이는 작업 유형과 개발자의 경험 수준에 따라 크게 달라집니다. LLM은 특히 새로운 도메인을 시작하거나 일회성 프로젝트를 수행할 때 비용을 줄이는 데는 효과적이라고 판단됩니다.

하지만 프로그래밍은 단순히 코드를 작성하는 것 이상입니다. 개발자의 시간 중 많은 부분이 요구사항 이해, 설계, 미팅, 코드 리뷰 등에 할애되는데, AI는 이 중 일부만 가속화할 수 있으며, 그마저도 완벽하지 않습니다. 예를 들어, AI는 회의를 10배 빠르게 진행하지 못하지만, 시니어 개발자들은 대부분의 시간을 그곳에서 보냅니다.

일부 개발자들은 LLM을 통해 피곤한 상태에서도 사이드 프로젝트를 진행할 수 있게 되었다고 이야기하는 경우도 있습니다. 물론 이는 개인 차원에서 큰 이점이지만, 기업 차원에서는 그 효과가 분산됩니다. 1,000명의 회사에서 10명만이 10배의 속도 향상을 경험한다면, 전체적으로는 약 10%의 속도 향상에 불과합니다.

실제 생산성 향상률: 대부분의 경우 10~30% 정도
새로운 도메인 시작: 학습 곡선 단축으로 큰 이점
일회성 프로젝트: 간단한 리팩토링과 같은 작업에 효과적
제약 이론: 프로그래머가 더 이상 병목이 아닐 때, 다른 제약이 더 구속력 있게 됨
미래 전망: 장기적 시야와 혁신을 위한 진정한 AGI 필요

일부 전문가들은 이것이 "제약 이론"의 문제라고 설명합니다. 단순화된 예로, 이전에 비즈니스 분석가 한 명, QA 테스터 한 명, 프로그래머 한 명이 각각 하루씩 필요했던 작업에서 프로그래머의 효율성이 두 배 또는 다섯 배로 증가해도 회사가 더 빨리 진행하도록 설정되어 있지 않기 때문에 결과물에는 영향이 없는 셈이지요. 이렇게 본다면 LLM은 개발자 생산성을 향상시키는 강력한 도구임에 분명하지만, 현재로서는 그 영향이 아직까지는 제한적이라고 사료됩니다. 진정한 변화는 단순히 도구를 사용하는 것이 아니라, 도구를 중심으로 프로세스와 접근 방식을 재구성할 때 일어날 것입니다.

"How Much Are LLMs Actually Boosting Real-World Programmer Productivity?"를 한글로 재구성하였습니다.

SidePlay

AI 시대 개발자 생산성 분석: LLM이 실제로 개발자 생산성을 얼마나 향상시키고 있을까?

개발자들의 LLM 생산성 향상 주장: 과대평가일까?

LLM의 실질적인 생산성 향상 사례와 한계

LLM이 개발자 생산성에 미치는 실제 영향: 자기 착각일까?

LLM의 개발자 생산성 향상: 현실과 미래

티스토리툴바