Lexical

1. 설명


Lexical Rewrite는 사용자의 질문(Query)을 **동의어, 형태 변환, 키워드 확장 등 단어 중심(lexical level)**으로 재작성하여 문서 검색 정확도를 높이는 Query Rewriting 기법입니다.

특히 BM25, TF-IDF 같은 키워드 기반 검색 알고리즘에서 효과가 큽니다.

즉, 질문의 의미(semantic)를 크게 바꾸지 않고 검색에 잘 걸리는 단어로 변환하는 것이 핵심입니다.

사용자가 일상적인 표현을 사용하면 이를 문서에서 실제로 사용되는 용어로 바꾸는 방식입니다.

2. 작동 방식


1 동의어 치환

car → automobile

2 전문 용어 변환

돈 보내기 → 계좌 이체

3 형태 변환

running → run

4 키워드 추가

간단한 질문을 핵심 키워드 중심 Query로 변환

5 Stopword 제거

의미 없는 단어(조사, 관사 등) 제거 → Stopword 참고

3. 장점 (Benefits)


  • 키워드 기반 검색 성능 향상 (BM25 기반 시스템에서 recall 개선)
  • 문서 용어와 사용자 표현 간 mismatch 해결
  • 구현이 비교적 간단
  • 검색 속도 유지 (Semantic search 대비 비용 낮음)
  • 기존 검색 인프라와 호환 (ElasticSearch, Solr 등)

4. 예제


일상/구어체 질의를 검색에 적합한 핵심 키워드·문구로 변환한 예시입니다.

input,output
이거 환불 가능한지 알려줘,환불 가능 여부
아이폰 배터리 언제 교체해야 해?,아이폰 배터리 교체 시기
회사 연차 규정 어떻게 돼?,회사 연차 규정
이게 정말 할인되는 거 맞아요?,할인 여부
혹시 교환도 가능한가요?,교환 가능 여부
좀 자세히 설명해줄 수 있어?,자세한 설명
정말 이 제품이 좋은 건가요?,제품 품질
아 진짜 배송은 언제 오는 거예요?,배송 일정
혹시 반품도 되나요?,반품 가능 여부
도대체 왜 이렇게 느린 거죠?,느린 이유
좀 더 싼 가격은 없나요?,저렴한 가격
혹시 사이즈 교환은 안 되나요?,사이즈 교환 가능 여부
이게 정말 필요한 건지 모르겠어요,필요 여부
아 좀 빨리 처리해줄 수 없나요?,빠른 처리
혹시 무료 배송도 되나요?,무료 배송 여부
정말 이게 최선인가요?,최선 여부
도대체 언제까지 기다려야 하나요?,대기 기간
좀 더 자세한 정보를 알려주세요,상세 정보
혹시 다른 색상도 있나요?,다른 색상 여부
이게 정말 안전한 건가요?,안전 여부
아 정말 복잡하네요,복잡함
혹시 할부 결제도 되나요?,할부 결제 가능 여부
좀 더 간단하게 설명해주세요,간단한 설명
도대체 이게 뭐하는 건가요?,기능 설명
정말 이 가격이 맞나요?,가격 확인
혹시 재고는 있나요?,재고 여부
아 이거 정말 어렵네요,어려움
좀 더 빠른 방법은 없나요?,빠른 방법
혹시 취소도 가능한가요?,취소 가능 여부
이게 정말 효과가 있는 건가요?,효과 여부
도대체 왜 이렇게 비싼 거죠?,비싼 이유
정말 이게 최신 모델인가요?,최신 모델 여부
혹시 A/S는 받을 수 있나요?,A/S 가능 여부
좀 더 큰 사이즈는 없나요?,큰 사이즈 여부
아 정말 불편하네요,불편함
혹시 무이자 할부도 되나요?,무이자 할부 가능 여부
이게 정말 품질이 좋은 건가요?,품질 확인
도대체 언제 배송되는 거예요?,배송 시기
정말 이게 추천 제품인가요?,추천 제품 여부
혹시 포인트 적립도 되나요?,포인트 적립 여부
좀 더 저렴한 옵션은 없나요?,저렴한 옵션
아 이거 정말 좋네요,좋음
혹시 환불도 가능한가요?,환불 가능 여부
이게 정말 인기 제품인가요?,인기 제품 여부
도대체 왜 이렇게 오래 걸리는 거죠?,지연 이유
정말 이게 정품인가요?,정품 여부
혹시 쿠폰 사용도 되나요?,쿠폰 사용 가능 여부
좀 더 작은 사이즈는 없나요?,작은 사이즈 여부
아 정말 빠르네요,빠름
혹시 색상 변경도 되나요?,색상 변경 가능 여부
이게 정말 내가 찾던 건가요?,제품 매칭 여부
도대체 이게 어떻게 사용하는 거죠?,사용 방법
정말 이게 할인 중인가요?,할인 중 여부
혹시 무료 체험도 되나요?,무료 체험 가능 여부
좀 더 상세한 스펙을 알려주세요,상세 스펙
아 이거 정말 유용하네요,유용함
혹시 보증 기간은 얼마나 되나요?,보증 기간
이게 정말 신제품인가요?,신제품 여부
도대체 왜 이렇게 작은 거죠?,작은 이유
정말 이게 베스트셀러인가요?,베스트셀러 여부
혹시 리뷰는 어디서 볼 수 있나요?,리뷰 확인 방법
좀 더 나은 제품은 없나요?,더 나은 제품
아 정말 만족스럽네요,만족
혹시 추가 할인도 되나요?,추가 할인 가능 여부
이게 정말 무료인가요?,무료 여부
도대체 이게 뭐가 다른 거죠?,차이점
정말 이게 안전하게 사용할 수 있는 건가요?,안전 사용 여부
혹시 설치도 해주나요?,설치 서비스 여부
좀 더 가벼운 제품은 없나요?,가벼운 제품
아 이거 정말 편리하네요,편리함
혹시 배송비는 얼마인가요?,배송비
이게 정말 내게 맞는 건가요?,적합 여부
도대체 왜 이렇게 무거운 거죠?,무거운 이유
정말 이게 최고인가요?,최고 여부
혹시 다른 모델도 있나요?,다른 모델 여부
좀 더 강력한 제품은 없나요?,강력한 제품
아 정말 실망스럽네요,실망
혹시 교환 기간은 얼마나 되나요?,교환 기간
이게 정말 합리적인 가격인가요?,합리적 가격 여부
도대체 이게 어떻게 작동하는 거죠?,작동 원리
정말 이게 인증 받은 건가요?,인증 여부
혹시 무료 샘플도 받을 수 있나요?,무료 샘플 여부
좀 더 작동 방식을 설명해주세요,작동 방식 설명
아 이거 정말 실용적이네요,실용성
혹시 멤버십 할인도 되나요?,멤버십 할인 가능 여부
이게 정말 내 상황에 맞는 건가요?,상황 적합 여부
도대체 왜 이렇게 비싼 거죠?,비싼 이유
정말 이게 검증된 제품인가요?,검증 여부
혹시 튜토리얼도 제공되나요?,튜토리얼 제공 여부
좀 더 사용 예시를 보여주세요,사용 예시
아 정말 만족스럽네요,만족
혹시 업그레이드도 가능한가요?,업그레이드 가능 여부
이게 정말 내 예산에 맞는 건가요?,예산 적합 여부
도대체 이게 뭐가 특별한 거죠?,특별함
정말 이게 추천할 만한 건가요?,추천 여부
혹시 고객 지원도 받을 수 있나요?,고객 지원 여부
좀 더 비교 정보를 알려주세요,비교 정보
아 이거 정말 효율적이네요,효율성
혹시 연장 보증도 되나요?,연장 보증 가능 여부
이게 정말 내가 원하는 건가요?,원하는 제품 여부
도대체 왜 이렇게 복잡한 거죠?,복잡한 이유
정말 이게 시중 최저가인가요?,최저가 여부
혹시 무료 상담도 받을 수 있나요?,무료 상담 여부
좀 더 구체적인 사용법을 알려주세요,구체적 사용법
아 정말 도움이 되네요,도움
혹시 추가 옵션도 선택할 수 있나요?,추가 옵션 선택 여부
이게 정말 내 스타일에 맞는 건가요?,스타일 적합 여부
도대체 이게 어떻게 도움이 되는 거죠?,도움 방법
정말 이게 최신 기술인가요?,최신 기술 여부
혹시 무료 업데이트도 되나요?,무료 업데이트 여부
좀 더 장점을 설명해주세요,장점 설명
아 이거 정말 혁신적이네요,혁신성
혹시 단점도 알려주실 수 있나요?,단점
이게 정말 내 문제를 해결해주는 건가요?,문제 해결 여부
도대체 왜 이렇게 인기가 많은 거죠?,인기 이유
정말 이게 투자할 만한 가치가 있는 건가요?,투자 가치 여부
혹시 무료 체험 기간은 얼마나 되나요?,무료 체험 기간
좀 더 구매 후기를 보여주세요,구매 후기
아 정말 기대되네요,기대
혹시 다른 색상 옵션도 있나요?,다른 색상 옵션 여부
이게 정말 내가 필요한 모든 기능을 갖춘 건가요?,필요 기능 포함 여부
도대체 이게 뭐가 장점인 거죠?,장점
정말 이게 경쟁 제품보다 좋은 건가요?,경쟁 제품 대비 우위 여부
혹시 무료 배송 조건은 어떻게 되나요?,무료 배송 조건
좀 더 상세한 비교표를 보여주세요,상세 비교표
아 이거 정말 완벽하네요,완벽함