AI 검색 시대 성과 측정법 — Search Console·GA4로 AI 유입·인용 보기

Prompt Architect 편집팀 · 2026-06-19 · 10분

TL;DR — AI 요약이 검색 결과를 채우면서 클릭은 줄어드는데, 기존 지표만 보면 무슨 일이 벌어지는지 알 수 없다. Search Console과 GA4에서 AI 유입·인용을 분리해 보는 실전 설정과 정규식을 정리한다.

AI 검색 시대가 되면서 수익형 블로그 운영자가 가장 먼저 부딪히는 문제는 "성과가 어떻게 되고 있는지 모르겠다"는 것이다. 노출은 그대로인데 클릭이 줄고, 어디선가 트래픽이 들어오는데 그게 ChatGPT인지 Perplexity인지 분간이 안 된다. 기존의 SEO 대시보드는 AI 요약(AI Overviews)이나 생성형 답변 엔진을 전제로 설계되지 않았기 때문이다.

이 글은 개념 설명이 아니라 실제로 어떤 지표를 어디서 보고, 어떻게 설정하는지에 집중한다. Google Search Console과 GA4에서 AI 유입을 분리하는 정규식·채널 그룹 설정, AI 답변 내 인용을 추적하는 방법, 그리고 운영자가 빠지기 쉬운 함정까지 다룬다. 전체 전략의 큰 그림은 SEO·AEO·GEO 완벽 정리에서 다루므로, 여기서는 "측정" 한 가지에 좁혀 들어간다.

왜 AI 검색 시대의 측정이 어려운가

전통적인 SEO 측정은 단순했다. 검색 노출 → 클릭 → 방문 → 전환이라는 깔끔한 깔때기가 있었고, 노출이 늘면 클릭이 늘고 클릭이 늘면 방문이 늘었다. AI 검색은 이 연결고리를 끊는다.

핵심 변화는 답변이 검색 결과 안에서 끝난다는 것이다. Google의 AI Overviews나 ChatGPT의 답변은 여러 출처를 요약해 사용자에게 바로 제공한다. 사용자는 답을 얻었으니 링크를 굳이 누르지 않는다. Pew Research Center가 2025년 발표한 조사에서도, 검색 결과에 AI 요약이 있을 때 사용자가 출처 링크를 덜 클릭하는 경향이 관찰됐다. 즉 "내 글이 AI 답변에 인용됐다"와 "내 글로 트래픽이 들어왔다"가 더 이상 같은 말이 아니다.

측정이 어려운 두 번째 이유는 데이터가 분산되기 때문이다. 과거엔 Search Console 하나면 검색 성과의 대부분을 봤다. 지금은 검색 노출은 Search Console, AI 엔진에서의 유입은 GA4의 referral, AI 답변 안에서의 인용 여부는 둘 다 잡지 못해 별도 추적이 필요하다. 한 화면에서 끝나던 측정이 세 갈래로 갈라진 셈이다.

세 번째는 합산과 불투명성이다. 뒤에서 보겠지만 AI Overviews 노출은 일반 검색 성과에 섞여 들어가고, AI 엔진들은 자기 답변에 어떤 출처를 썼는지 운영자에게 친절히 알려주지 않는다. 그래서 "정확히"가 아니라 "추정과 신호"로 측정해야 한다는 마음가짐이 필요하다.

Google Search Console에서 보는 신호

Search Console은 여전히 AI 검색 측정의 출발점이다. 다만 보는 법이 달라져야 한다.

먼저 알아야 할 사실: Google은 AI 기능에 노출되기 위해 특수 마크업이나 별도의 AI 전용 파일이 필요하지 않다고 공식 안내한다(developers.google.com/search/docs/appearance/ai-features). AI Overviews 노출의 기반은 표준 SEO와 구조화 데이터다. 즉 측정 측면에서도 "AI 전용 리포트"가 따로 있는 게 아니라, 기존 성과 리포트 안에 AI 노출이 섞여 들어간다.

그래서 Search Console에서 실질적으로 보는 신호는 다음과 같다.

노출(Impressions) 대비 CTR 변화: AI Overviews가 특정 쿼리 상단을 차지하면, 노출은 유지되거나 늘어도 CTR이 떨어지는 패턴이 나타난다. 페이지·쿼리별로 "노출은 그대로인데 클릭만 빠진" 항목을 찾으면 AI 요약에 자리를 내줬을 가능성이 있다.
쿼리 유형별 분리: 정보성·정의형 쿼리("~~란 무엇", "~~ 방법")는 AI 요약에 흡수되기 쉽고, 비교·구매·고유명사 쿼리는 클릭이 더 잘 유지된다. 쿼리 보고서에서 이 두 그룹의 CTR 추세를 따로 보면 AI의 영향을 가늠할 수 있다.
기간 비교: "날짜 비교" 기능으로 동일 페이지의 직전 기간 대비 노출/CTR을 비교한다. AI Overviews가 확산된 시점 전후를 끊어 보면 변화가 더 선명하다.

한계도 분명히 인지해야 한다. AI Overviews 노출/클릭은 일반 검색 성과에 합산되며, 전용 필터로 "이건 AI Overviews 노출, 이건 일반 노출"이라고 깔끔히 분리해 측정하기는 어렵다. 따라서 Search Console에서는 "정확한 AI 노출 수치"가 아니라 CTR 하락이라는 간접 신호를 읽는다고 생각하는 편이 현실적이다.

GA4에서 AI 유입 분리하기

AI 엔진에서 사용자가 링크를 눌러 들어오면, GA4에서는 보통 referral 트래픽으로 잡힌다. 문제는 기본 채널 그룹이 chatgpt.com이나 perplexity.ai를 "AI 검색"으로 묶어주지 않는다는 점이다. 그냥 Referral에 흩어진다. 그래서 직접 분리해야 한다.

대표적인 AI 엔진의 참조 도메인은 다음과 같다.

chatgpt.com          # ChatGPT
perplexity.ai        # Perplexity
gemini.google.com    # Google Gemini
copilot.microsoft.com # Microsoft Copilot

가장 깔끔한 방법은 GA4의 **맞춤 채널 그룹(Custom channel group)**을 만들어 "AI Referral"이라는 채널을 추가하는 것이다. 관리 → 데이터 표시 → 채널 그룹에서 새 채널 그룹을 만들고, 새 채널 조건을 다음과 같은 정규식으로 세운다.

# 조건: Session source matches regex
^(chatgpt\.com|perplexity\.ai|gemini\.google\.com|copilot\.microsoft\.com)$

조금 더 넉넉히 잡고 싶다면 서브도메인과 변형까지 포함하는 형태로 쓴다.

.*(chatgpt|openai|perplexity|gemini\.google|copilot\.microsoft|bing).*

단, 위 "느슨한" 정규식은 오탐(예: bing 일반 검색이 섞임) 위험이 있으므로, 분리 측정이 목적이라면 첫 번째의 엄격한 도메인 매칭을 권장한다. 채널 그룹을 새로 만들면 그 시점 이후 데이터부터 새 채널로 분류되니, 가능한 한 빨리 만들어 두는 게 좋다.

채널 그룹을 만들기 번거롭다면, 탐색(Exploration) 보고서에서 임시로 보는 방법도 있다. 측정기준에 "세션 소스"를 놓고, 필터에 위 도메인을 정규식으로 걸면 AI 엔진별 세션·참여도·전환을 그 자리에서 비교할 수 있다. 채널 그룹은 소급 적용이 안 되지만, 탐색 필터는 과거 데이터에도 적용되므로 "지난 90일간 AI 유입이 얼마였나"를 확인할 때 유용하다.

주의할 점: AI 엔진이 항상 referral을 정직하게 넘기는 것은 아니다. 앱 내 브라우저나 일부 클라이언트에서는 참조 정보가 누락돼 (direct)로 들어오기도 한다. 그래서 GA4의 AI 유입 수치는 **하한선(최소한 이만큼은 AI에서 왔다)**으로 읽는 것이 안전하다.

AI 답변 내 인용·언급 추적

지금까지가 "AI를 거쳐 들어온 트래픽"이라면, 이번엔 한 단계 앞, AI 답변 안에 내 사이트가 등장했는가를 본다. 트래픽이 없어도 인용은 브랜드 노출이자 신뢰 신호이기 때문이다.

여기서 두 가지 개념이 등장한다.

인용률(Citation rate): 특정 주제·키워드를 AI에 물었을 때, 내 콘텐츠가 출처로 인용되는 비율. "내가 다루는 100개 질문 중 몇 개에서 내 글이 인용되나"를 추적한다.
SOV(Share of Voice, 점유율): 같은 질문군에서 경쟁사 대비 내 브랜드가 언급·인용되는 비중. 절대 인용 수보다 "경쟁 대비 위치"를 보여준다.

문제는 Search Console·GA4 어느 쪽도 이 데이터를 주지 않는다는 것이다. AI 답변은 매번 조금씩 다르고, 개인화·시점에 따라 출처가 바뀐다. 그래서 인용 추적은 반복 질의로 표본을 모으는 방식으로 한다. 추적 도구(또는 자체 스크립트)가 하는 일은 대체로 이렇다.

내 주제와 관련된 질문 목록(프롬프트 세트)을 정한다.
여러 AI 엔진(ChatGPT 검색, Perplexity, Gemini 등)에 주기적으로 같은 질문을 던진다.
답변 텍스트와 출처 목록에서 내 도메인·브랜드명이 등장하는지 파싱한다.
시간에 따른 인용률·SOV 추세를 기록한다.

돈을 들이지 않고 시작하려면, 핵심 질문 10~20개를 골라 주 1회 직접 물어보고 스프레드시트에 기록하는 것만으로도 충분히 의미 있는 추세를 만들 수 있다. "인용됨/안 됨", "몇 번째 출처", "경쟁사 함께 인용됨?" 정도만 남겨도 한 달이면 패턴이 보인다. 어떤 글이 잘 인용되는지 파악되면, GEO 인용 체크리스트에 맞춰 인용 친화적으로 글을 보강하는 식으로 측정과 개선을 연결할 수 있다.

참고로 "무엇이 인용을 늘리는가"에 대해서는 학술적 근거도 있다. 생성형 엔진 최적화를 다룬 GEO 논문(Aggarwal 외, arXiv:2311.09735, KDD 2024)은 출처 인용 추가·인용문 추가·통계 추가 같은 기법이 생성형 답변 내 가시성을 최대 40% 안팎까지 끌어올릴 수 있다고 보고했다(개선폭은 기법·엔진에 따라 다름). 측정 지표(인용률)와 개선 기법이 같은 선상에 있다는 뜻이다.

핵심 지표 정의

혼란을 줄이려면 보는 지표를 명확히 정의해 두는 게 좋다. 운영자 입장에서 실제로 추적할 만한 네 가지는 다음과 같다.

노출(Impressions): 검색 결과(AI Overviews 포함)에 내 페이지가 표시된 횟수. 출처는 Search Console. AI 노출이 합산돼 있다는 점을 전제로 본다.
CTR(클릭률): 노출 대비 클릭 비율. AI 시대엔 "노출 유지, CTR 하락"이 AI 요약 흡수의 대표 신호다.
AI 유입(AI referral sessions): GA4에서 AI 엔진 도메인으로부터 들어온 세션. 위 채널 그룹/정규식으로 분리. 하한선으로 해석.
인용률(Citation rate): 정의한 질문 세트 중 내 콘텐츠가 AI 답변에 인용된 비율. 자체 추적 표본 기반.

이 네 가지를 한 줄로 꿰면 이렇게 읽힌다. "검색에는 (노출) 잘 뜨는데 (CTR) 클릭이 빠지고 있고, 대신 (AI 유입) AI 쪽에서 일부 들어오며, (인용률) AI 답변엔 이 정도 비율로 인용된다." 네 지표가 함께 있어야 AI 검색 시대의 성과를 입체적으로 본다.

흔한 함정

측정을 시작한 운영자들이 반복적으로 빠지는 함정 몇 가지를 짚는다.

1. 인용을 트래픽으로 착각한다. 가장 큰 함정이다. AI 답변에 인용됐다고 방문이 생기는 게 아니다. 앞서 본 Pew 조사처럼 AI 요약은 오히려 클릭을 줄인다. 인용률과 트래픽은 별개의 지표로 따로 관리해야 한다. 인용은 브랜드·신뢰 지표, 트래픽은 수익 지표다.

2. 허수 지표에 매달린다. "AI 노출이 몇 만 회" 같은 숫자는 합산·추정이 섞여 정밀하지 않다. 절대값에 일희일비하기보다 같은 측정 방법으로 시계열 추세를 보는 게 정확하다. 방법을 자주 바꾸면 추세가 깨진다.

3. referral을 100% 신뢰한다. GA4의 AI 유입은 참조 정보 누락 때문에 과소 계상되기 쉽다. "정확한 AI 트래픽"이 아니라 "최소한 이만큼"으로 본다.

4. 정규식을 너무 느슨하게 짠다. AI 도메인 매칭을 광범위하게 잡으면 일반 검색·광고 트래픽이 섞여 AI 유입이 부풀려진다. 분리 측정이 목적이라면 도메인을 명시적으로 매칭하는 엄격한 정규식을 쓴다.

5. AI 전용 마법의 설정을 찾는다. Search Console에 "AI Overviews 전용 필터"는 없고, Google도 별도 AI 파일이 불필요하다고 안내한다. 표준 SEO 데이터 안에서 신호를 읽는 것이 정공법이다.

간단 대시보드 구성안

도구를 새로 사지 않고도 시작할 수 있는 최소 대시보드를 제안한다. 주 1회, 길어야 30분이면 갱신할 수 있는 수준이다.

블록 1 — 검색 성과(Search Console): 상위 20개 페이지의 노출·CTR을 직전 기간과 비교. "노출 유지, CTR 하락" 페이지를 빨간색으로 표시. 이게 AI 요약 영향 후보다.
블록 2 — AI 유입(GA4): 위에서 만든 "AI Referral" 채널 그룹의 세션·참여율·전환을 엔진별로. 추세선 한 줄.
블록 3 — 인용률(자체 추적): 핵심 질문 10~20개의 이번 주 인용 여부 체크리스트. "인용 X/20, 전주 대비 ±N".
블록 4 — 메모: 이번 주 발행/수정한 글, 인용이 새로 잡힌 글, 다음 주 보강 대상.

구현은 Google Looker Studio에 Search Console·GA4를 연결하면 블록 1·2는 자동화되고, 블록 3·4만 수기로 채우면 된다. 처음부터 완벽한 대시보드를 만들려 하지 말고, 같은 형식을 매주 반복하는 것이 핵심이다. 추세는 일관성에서 나온다.

AI에게 물어볼 때 (프롬프트 팁)

GA4 채널 그룹 정규식이나 인용 추적 프롬프트를 직접 짜기 막막하다면, AI에게 이렇게 물어보면 실전에 가까운 답을 얻는다.

나는 GA4를 운영하는 블로그 운영자야.
ChatGPT, Perplexity, Gemini, Copilot에서 들어오는 referral을
"AI Referral" 하나의 맞춤 채널 그룹으로 묶고 싶어.
오탐(일반 검색 섞임)을 최소화하는 엄격한 정규식과,
넉넉하게 잡는 느슨한 정규식 두 가지를 각각 만들어주고,
GA4 어디서 어떻게 설정하는지 단계도 알려줘.

내 사이트 도메인은 example.com 이고 주제는 "AI 프롬프트 작성법"이야.
이 주제로 ChatGPT·Perplexity에 던질 인용 추적용 질문 15개를 만들어줘.
각 질문 옆에 "이 질문에서 내 글이 인용되려면 어떤 정보가 필요한지"를 한 줄로 덧붙여줘.
표 형식으로 정리해줘.

프롬프트가 의도대로 동작하는지, 더 또렷하게 다듬을 여지는 없는지 점검하고 싶다면 Prompt Architect 프롬프트 분석기로 한 번 돌려 보자.