AI가 과제를 대신 하는 시대: 이제 무엇을 '실력'이라 부를 것인가?

생성형 AI가 디자인과 코딩의 진입장벽을 허문 지금, 결과물 중심의 평가 체계를 넘어 프로세스와 비판적 사고를 측정하는 새로운 평가 패러다임이 필요합니다.

우리는 지금껏 ‘결과물’로 능력을 증명해온 시대에 살았습니다. 디자이너는 완성된 피그마 시안으로, 개발자는 작동하는 코드로, 기획자는 정교한 PRD 문서로 자신의 가치를 입증했습니다. 하지만 생성형 AI의 등장은 이 견고했던 증명 방식을 뿌리째 흔들고 있습니다. 이제는 숙련된 전문가가 며칠 밤을 새워 만들던 고품질의 디자인 시안이나 복잡한 로직의 코드를 AI가 단 몇 초 만에 쏟아냅니다. 여기서 치명적인 문제가 발생합니다. 결과물이 상향 평준화되면서, 우리가 기존에 사용하던 ‘결과물 기반의 평가 방식’으로는 누가 진짜 실력자인지, 누가 AI의 결과물을 단순히 복사해 붙여넣었는지 구분할 수 없게 된 것입니다.

단순히 AI 사용을 금지하거나 표절 검사기를 도입하는 것은 임시방편에 불과합니다. AI는 이제 도구를 넘어 사고의 파트너가 되었으며, 이를 능숙하게 다루는 능력 자체가 핵심 경쟁력이 되었습니다. 그렇다면 우리는 이제 무엇을 평가해야 할까요? 정답은 ‘결과’가 아니라 ‘과정’과 ‘의사결정의 근거’에 있습니다.

결과물의 시대에서 ‘의사결정’의 시대로

AI가 생성한 디자인은 겉보기에 완벽할 수 있습니다. 하지만 그 디자인이 왜 사용자의 페인 포인트(Pain Point)를 해결하는지, 왜 이 색상과 레이아웃이 비즈니스 목표에 부합하는지에 대한 논리적 근거는 AI가 아닌 인간의 영역입니다. 과거에는 툴을 다루는 숙련도(Tool Proficiency)가 평가의 큰 비중을 차지했다면, 이제는 AI가 제시한 여러 선택지 중 최적의 안을 골라내는 ‘큐레이션 능력’과 ‘비판적 분석력’이 실력의 척도가 되어야 합니다.

이는 교육 현장뿐만 아니라 기업의 채용과 성과 평가에도 동일하게 적용됩니다. 포트폴리오에 담긴 화려한 결과물보다, 그 결과물에 도달하기 위해 어떤 프롬프트를 설계했고, AI의 오류를 어떻게 수정했으며, 최종적으로 어떤 판단 기준을 통해 디자인을 확정했는지를 추적하는 ‘로그(Log) 기반 평가’가 도입되어야 하는 이유입니다.

AI 시대의 새로운 평가 프레임워크

단순한 제출물 평가에서 벗어나기 위해 다음과 같은 다각적 접근이 필요합니다.

프로세스 투명성 확보: 최종 결과물과 함께 AI와의 대화 기록, 수정 이력, 초기 아이디어 스케치를 함께 제출하게 하여 사고의 흐름을 평가합니다.
구두 변론 및 라이브 리뷰: 결과물의 특정 부분에 대해 ‘왜 이렇게 설계했는가?’라는 질문을 던지고, 이에 대해 논리적으로 방어할 수 있는 능력을 측정합니다.
제약 조건의 부여: AI가 쉽게 해결할 수 없는 아주 구체적이고 특수한 비즈니스 제약 조건이나 엣지 케이스(Edge Case)를 설정하여, 인간의 창의적 문제 해결 능력을 시험합니다.
비판적 수정 과제: AI가 생성한 ‘그럴듯하지만 틀린’ 결과물을 제시하고, 이를 분석하여 올바르게 수정하는 능력을 평가합니다.

실무 적용 사례: 디자인 리뷰의 변화

최근 일부 선도적인 프로덕트 팀에서는 디자인 리뷰 방식을 완전히 바꾸고 있습니다. 과거에는 ‘이 버튼의 위치가 적절한가?’를 논의했다면, 이제는 ‘AI가 제안한 3가지 시안 중 A안을 선택한 전략적 이유는 무엇인가?’를 묻습니다. AI가 생성한 시안은 기본값(Baseline)이 되었고, 디자이너의 역할은 그 기본값 위에 브랜드의 철학과 사용자 경험의 디테일을 얹는 ‘디렉팅’으로 진화했습니다.

예를 들어, 한 이커머스 기업은 신입 디자이너 평가 시 완성된 페이지 디자인 대신, AI를 활용해 10가지 서로 다른 가설의 UI를 빠르게 생성하고 그중 가장 전환율이 높을 것으로 예상되는 안을 논리적으로 선택하는 ‘가설 검증 프로세스’를 평가 항목으로 넣었습니다. 이는 툴 숙련도가 낮은 신입이라도 전략적 사고 능력이 뛰어나다면 충분히 고평가받을 수 있는 구조를 만듭니다.

기술적 구현과 평가의 딜레마

물론 이러한 변화에는 기술적, 제도적 어려움이 따릅니다. 모든 과정의 로그를 기록하고 검토하는 것은 평가자에게 엄청난 리소스 소모를 야기합니다. 또한, AI 활용 능력이 개인의 프롬프트 엔지니어링 숙련도에 따라 갈린다면, 이는 또 다른 형태의 ‘디지털 격차’를 만들어낼 수 있습니다.

하지만 이를 해결하기 위해 우리는 AI를 평가의 적이 아닌, 평가의 도구로 활용해야 합니다. AI가 학생이나 직원의 작업 로그를 1차적으로 분석하여 ‘사고의 도약’이 일어난 지점이나 ‘단순 복제’가 의심되는 구간을 하이라이트 해주면, 인간 평가자는 그 핵심 지점에 집중해 심층 면접을 진행하는 효율적인 협업 구조를 만들 수 있습니다.

실무자와 리더를 위한 액션 아이템

지금 당장 조직의 평가 체계를 바꾸기 어렵다면, 다음의 작은 단계부터 시작해 보십시오.

질문의 방향을 바꾸십시오: “어떻게 만들었나요?” 대신 “왜 이 방식이 최선이라고 생각했나요?”라고 물으십시오.
‘과정 기록’을 공식화하십시오: 결과물 제출 시 사용한 AI 툴과 프롬프트의 핵심 전략을 짧게 기술하는 섹션을 추가하십시오.
결과물 중심의 보상을 지양하십시오: 단순히 ‘예쁜 디자인’이나 ‘작동하는 코드’가 아니라, 문제 정의의 정확성과 해결 과정의 논리성에 더 높은 가중치를 두십시오.
AI 리터러시 교육을 병행하십시오: 무조건적인 사용이나 금지가 아니라, AI의 한계를 이해하고 비판적으로 수용하는 방법을 조직 내에서 공유하십시오.

결론: 인간만이 할 수 있는 ‘가치 판단’의 영역

AI는 정답에 가까운 ‘평균’을 내놓는 데 탁월합니다. 하지만 비즈니스의 성공은 평균이 아니라, 때로는 평균을 깨뜨리는 파격적인 통찰과 사용자에 대한 깊은 공감에서 옵니다. AI가 디자인을 생성할 수는 있어도, 그 디자인이 사용자에게 어떤 감동을 줄지, 브랜드의 미래 가치와 어떻게 연결될지를 결정하는 것은 여전히 인간의 몫입니다.

평가 체계의 변화는 단순히 성적을 매기는 방식의 변화가 아니라, 우리가 정의하는 ‘인재상’의 변화를 의미합니다. 이제 우리는 ‘잘 만드는 사람’이 아니라 ‘제대로 생각하는 사람’을 찾아내고 키워내야 합니다. 그것이 AI 시대에 우리가 생존하고 성장할 수 있는 유일한 길입니다.

FAQ

Teaching in the Age of AI: How aI Generated Design Changes Evaluation의 핵심 쟁점은 무엇인가요?

핵심 문제 정의, 비용 구조, 실제 적용 방법, 리스크를 함께 봐야 합니다.

Teaching in the Age of AI: How aI Generated Design Changes Evaluation를 바로 도입해도 되나요?

작은 범위에서 실험하고 데이터를 확인한 뒤 단계적으로 확대하는 편이 안전합니다.

실무에서 가장 먼저 확인할 것은 무엇인가요?

목표 지표, 대상 사용자, 예산 범위, 운영 책임자를 먼저 명확히 해야 합니다.

법률이나 정책 이슈도 함께 봐야 하나요?

네. 데이터 수집 방식, 플랫폼 정책, 개인정보 관련 제한을 반드시 점검해야 합니다.

성과를 어떻게 측정하면 좋나요?

비용, 전환율, 클릭률, 운영 공수, 재사용 가능성 같은 지표를 함께 보는 것이 좋습니다.

지금 바로 시작할 수 있는 실무 액션

현재 팀의 AI 활용 범위와 검증 절차를 먼저 문서화합니다.
작은 파일럿 프로젝트로 KPI를 정하고 2~4주 단위로 검증합니다.
보안, 품질, 리뷰 기준을 자동화 도구와 함께 연결합니다.

정보로부자되세요(정.보.부.자)

AI가 과제를 대신 하는 시대: 이제 무엇을 ‘실력’이라 부를 것인가?