Real-ESRGAN vs Topaz: 어떤 업스케일러가 더 뛰어날까?

안녕하세요, Dora입니다. 사소한 계기로 시작된 일이었습니다. 슬라이드 덱을 준비하다가 작은 로고를 깨지지 않게 확대해야 했거든요. 제 컴퓨터에는 이미 Real-ESRGAN 이 설치되어 있었고, 친구는 계속 Topaz를 써보라고 권했습니다. 승자를 가리려던 게 아니었어요. 그냥 눈이 찌푸려지지 않으면 됐습니다.

그래서 2026년 2월~3월의 며칠 저녁 동안, 같은 이미지 세트를 두 도구에 모두 돌려봤습니다. 스캔한 가족 사진, 모션 블러가 있는 폰 사진 몇 장, 게임 텍스처 두 장, 그리고 저해상도 로고가 대상이었습니다. GitHub 빌드의 Real-ESRGAN(모델 변형: x4plus, x4plus-anime, RealESRGAN_x4plus_ncnn)과 Topaz Photo AI 3.x(테스트 시점의 현재 빌드)를 사용했습니다. 마법을 찾는 게 아니었습니다. 필요할 때 더 가볍게 느껴지고, 그렇지 않을 때도 견딜 수 있는 방법을 찾고 싶었을 뿐입니다.

Real-ESRGAN vs Topaz: 핵심 요약

긴 설명 없이 결론부터 말씀드리겠습니다. 결과물이 빠르게 좋아 보여야 하고 조정이 최소화되어야 할 때는 Topaz를 선택했습니다. 제어력과 반복성이 필요하고, 스크립트로 만들거나 설명할 수 있는 워크플로우가 필요할 때는 Real-ESRGAN을 선택했습니다.

초보자에게 적합한 것

Topaz입니다. 질문이 더 적습니다. 이미지를 넣고 슬라이더 하나둘을 조정하면 첫 시도에서 대부분 괜찮은 결과가 나왔습니다. 비기술적인 분들이나 이미 머릿속이 꽉 찬 날에는 그게 중요합니다.

제어와 실험에 적합한 것

Real-ESRGAN입니다. 초기에 손이 더 가지만, 프리셋과 스크립트를 몇 개 설정하고 나면 일관된 배치 작업을 실행하고 이미지 유형별로 모델을 조정할 수 있었습니다. 모델이 실제로 무엇을 하는지 보고 싶고, “스마트” 자동화보다 투명한 조작을 선호한다면 이쪽이 더 낫습니다.

실제로 비교하는 것

단순히 모델 대 모델의 문제가 아닙니다. 워크플로우 선택의 문제입니다. 오늘날 일부 크리에이터들은 처음부터 시각 요소를 재구성할 때 전통적인 업스케일러와 Z-Image Turbo 같은 최신 AI 이미지 생성 도구를 혼합해서 사용하기도 합니다.

오픈소스 모델 워크플로우

Real-ESRGAN을 쓸 때는 모델, 플래그, 때로는 다른 빌드(CUDA vs NCNN)를 직접 선택합니다. 할 수 있는 것과 없는 것에 대해 솔직합니다. 실패했을 때 어디를 봐야 할지 압니다: 모델 선택, 노이즈 수준, 사전 노이즈 제거, 보간. 장점은 제어력과 비용입니다. 단점은 설정에 드는 시간과 가끔 빠져드는 토끼굴입니다.

궁금하신 분들을 위해: Real-ESRGAN은 여기 있습니다: Real‑ESRGAN on GitHub. 문서는 괜찮지만, 조각들을 직접 이어 붙여야 합니다.

유료 완성형 제품 워크플로우

Topaz Photo AI는 여러 모델(선명화, 노이즈 제거, 업스케일)을 깔끔한 인터페이스 뒤에 감싸놓았습니다. 문제를 자동으로 감지하고 스택을 제안합니다: 노이즈 제거, 디테일 복원, 업스케일. 재정의할 수 있지만 기본 경로는 “제가 처리할게요”입니다. 그게 매력입니다. 속도와 괜찮은 첫 결과를 위해 어느 정도의 투명성을 포기하는 셈입니다. 공식 정보: Topaz Photo AI.

출력 품질 비교

총 7세트를 돌렸습니다: 스캔한 4x6 인화지 2장, 2009년 스마트폰 사진(모션 블러) 1장, 저해상도 로고(단색) 1장, 게임 텍스처(거친 표면) 2장, 단체 사진에서 잘라낸 작은 인물 사진 1장. 별도 언급이 없으면 4x 업스케일을 했습니다. 제가 본 결과는 다음과 같습니다.

텍스처 복원

오래된 인화지: Real-ESRGAN(x4plus)이 종이 결과 직물 조직을 사실적으로 살려냈습니다. Topaz는 때때로 결을 매끄럽게 처리한 뒤 그 위에 마이크로 디테일을 새로 만들어냈습니다. 일반 배율에서는 둘 다 선명해 보였지만, 확대해보면 Real-ESRGAN이 더 “필름 같은” 느낌이었습니다.
게임 텍스처: Real-ESRGAN이 콘크리트와 스터코의 거친 질감을 더 잘 보존했습니다. 일부 아티스트들은 이제 전통적인 업스케일링을 완전히 건너뛰고 AI 이미지-투-이미지 생성 워크플로우로 텍스처를 재구성하기도 합니다. Topaz는 선명도를 강조해 엣지에는 도움이 됐지만 가끔 없던 먼지를 반점으로 만들기도 했습니다.
로고와 UI: Topaz가 기본 설정에서 더 깔끔한 엣지를 냈습니다. Real-ESRGAN은 사전 처리(벡터 재추적 또는 전용 모델)가 있을 때 좋아졌습니다. 준비 작업을 원하지 않는다면 여기서는 Topaz가 낫습니다.

노이즈 및 선명화 동작

고감도 폰 사진: Topaz의 노이즈 제거+선명화 파이프라인이 제가 우려하던 “밀랍 같은” 느낌 없이 뭉개짐을 줄여줬습니다. Real-ESRGAN 단독으로는 너무 거칠거나 선명도가 부족했습니다. 가벼운 노이즈 제거 사전 처리(예: 기본 NR)와 결합하면 많이 좋아졌지만, 한 단계가 아닌 두 단계였습니다.
인물 클로즈업: Topaz는 모공을 절제하고 피부를 깨끗하게 처리했습니다. Real-ESRGAN은 마이크로 텍스처를 보존했지만 주근깨와 작은 아티팩트를 과장할 수 있었습니다. 피사체에 따라 솔직한 표현이 될 수도, 불리한 표현이 될 수도 있습니다.

각각 인위적으로 보이는 부분

Real-ESRGAN: 어려운 얼굴에서 눈썹/속눈썹을 가끔 만들어냄. 텍스트나 선화에서 사전 처리 없이는 희미한 헤일로. 소스가 매우 흐릿하면 잎사귀에 작은 반복 패턴이 생길 수 있음.
Topaz: 선명화를 강하게 주면 머리카락과 직물 엣지가 과도하게 선명해짐. 평평한 그라디언트(하늘, 스튜디오 배경)에서 희미한 “플라스틱 선명도”. 노이즈가 심한 파일에서 디테일을 너무 자신있게 추측하는 경향.

쉽게 말하면: Real-ESRGAN은 원본의 개성을 유지하는 경향이 있고, Topaz는 클라이언트 덱에 바로 쓸 수 있을 것 같은 깔끔하게 정리된 버전을 제시하는 경향이 있습니다. 어느 쪽을 원하는지는 목적에 따라 다릅니다.

워크플로우 비교

저에게는 이게 가장 큰 차이였습니다.

설정 시간

Real-ESRGAN: 윈도우 노트북에서 첫 설정에 약 30~40분이 걸렸습니다(CUDA 설치, 모델 다운로드, 빠른 테스트). MacBook(M3)에서는 NCNN 빌드가 더 간단해서 처음 업스케일까지 약 15분이었습니다. 그 이후로는 마찰이 없었습니다.
Topaz: 설치, 라이선스, 끝. 첫 사용 가능한 결과까지 3~5분. 플래그에 대해 추측할 필요가 없었습니다.

배치 작업

Real-ESRGAN: 스크립트화하고 나면 탁월합니다. 데스크탑 GPU에서 120개의 텍스처 폴더를 약 18분 만에 무인으로 돌렸습니다. 로그가 명확했습니다. 뭔가 이상해 보이면 다른 모델 플래그로 하위 세트를 다시 실행할 수 있었습니다.
Topaz: UI를 통한 배치가 60개 이미지에서도 잘 작동했지만 더 자주 확인했습니다. 자동 감지가 빗나갔을 때(예: 노이즈 제거가 먼저 필요한 것을 선명화한 경우) 멈추고 조정해야 했습니다. 끔찍하지는 않았지만, 더 많은 감독이 필요했습니다.

안정적인 결과를 얻는 용이성

Real-ESRGAN: 새로운 콘텐츠 유형의 처음 두 번은 거의 “최종본”이 아닙니다. 하지만 세 번째 즈음에는 모델+가벼운 사전 처리의 조합이 반복 가능한 레시피가 됩니다. 안정성은 주어지는 게 아니라 얻어지는 것입니다.
Topaz: 첫 번째 결과가 대개 충분히 좋습니다. 틀릴 때는 자신있게 틀립니다. 큰 배치를 믿기 전에 얼굴과 엣지를 훑어보는 법을 배웠습니다. 그래도 평균적으로 괜찮은 출력까지의 시간은 더 짧았습니다.

비용 vs 시간 트레이드오프

한 클라이언트 폴더(주로 이벤트 사진 86장 혼합)에 대해 대략적인 기록을 남겼습니다.

Topaz 경로: 가져오기 → 자동 → 가벼운 조정 → 내보내기. 총 직접 소요 시간 약 22분. 기계 시간 약 35분. 6개 이미지에 두 번째 처리가 필요했습니다.
Real-ESRGAN 경로: 빠른 분류 → 가장 나쁜 20개에 노이즈 제거 사전 처리 → Real-ESRGAN x4 → 납품 크기로 다운스케일. 직접 소요 시간 약 38분(더 많은 정렬), 기계 시간 약 31분. 11개 이미지에 두 번째 처리가 필요했지만, 재실행은 스크립트로 처리했습니다.

Topaz 유료 구매가 가치 있는 경우

클라이언트에게 이미지를 전달하면서 돌봄 없이 매력적인 기본값을 원할 때.
모델, 드라이버, 스크립트를 유지 관리하고 싶지 않을 때.
노이즈 제거, 선명화, 업스케일을 한 번에 처리하는 경우—통합 파이프라인이 중요합니다.

실질적으로: 시간이 청구 대상이거나 컨텍스트 전환이 많다면, Topaz는 금방 본전을 뽑습니다.

Real-ESRGAN으로도 충분한 경우

소규모 설정에 익숙하고, 픽셀에 무슨 일이 일어났는지 정확히 알고 싶을 때.
유사한 콘텐츠(텍스처, 스캔 사진 등)를 대량으로 배치하면서 안정적이고 문서화 가능한 레시피를 원할 때.
편의보다 예산이 더 중요하거나, 라이선스 처리가 번거로운 서버에 배포할 때.

물론: 스크립트화하거나 예약하거나 헤드리스로 실행해야 하는 것이 있다면, Real-ESRGAN이 시스템에 더 깔끔하게 맞습니다.

사용 사례별 추천

일반 크리에이터

한 달에 몇 번 에디터를 열고 이미지가 그냥 더 이상 지쳐 보이지 않기를 원한다면 Topaz를 사용하세요. 조작이 편안합니다. 자동 제안이 괜찮습니다. 어떻게 고칠지보다 어떤 사진을 남길지 결정하는 데 더 많은 시간을 쓰게 됩니다. 나중에 세밀한 제어가 궁금해지면 Real-ESRGAN을 시도해볼 수 있지만, 일반적인 한 주를 보내기 위해 그게 필요하지는 않습니다. 일부 크리에이터들은 이미지 품질이 복원되면 제품 사진을 짧은 AI 영상으로 만드는 단계까지 나아가기도 합니다.

기술 사용자

재현 가능한 파이프라인을 좋아하거나, 일정에 따라 수백 개의 에셋을 처리해야 한다면 Real-ESRGAN부터 시작하세요. 플래그를 저장하세요. 작은 스크립트를 작성하세요. 필요할 때 가벼운 노이즈 제거 도구와 결합하세요. 생각 없이 빠르게 클라이언트 친화적인 결과물을 원할 때는 Topaz를 곁에 두세요—하지만 일상적인 작업은 아마 오픈소스로 하게 될 겁니다.

예산을 고려하는 사용자

Real-ESRGAN은 무료로 많은 것을 해냅니다. 돈 대신 시간을 요구합니다. 일관된 납품이 중요하고 여유가 된다면, Topaz는 절약되는 분(分)보다 줄어드는 인지 부하로 더 빠르게 본전을 뽑아줍니다. 하지만 프로세스를 꼼꼼히 관리한다면 Real-ESRGAN도 충분합니다.

마지막으로 한 가지만 덧붙이겠습니다. 일주일 동안 두 도구를 번갈아 사용하다 보니, Topaz를 열 때마다 약간 긴장이 풀리는 걸 느꼈습니다—결정이 줄어드니까요. 하지만 Real-ESRGAN 터미널 창도 항상 고정해두었습니다. 필요할 때 내부를 보고 조종할 수 있다는 것을 아는 것만으로도… 전체 설정이 더 견고하게 느껴졌습니다. 그 긴장감이 사라지지 않을 것 같고, 그래도 괜찮습니다.