본문 바로가기

백준 1181번 단어 정렬 (JAVA)

@6uiw2026. 1. 16. 16:33

문제

알파벳 소문자로 이루어진 N개의 단어가 들어오면 아래와 같은 조건에 따라 정렬하는 프로그램을 작성하시오.

  1. 길이가 짧은 것부터
  2. 길이가 같으면 사전 순으로

단, 중복된 단어는 하나만 남기고 제거해야 한다.

입력

첫째 줄에 단어의 개수 N이 주어진다. (1 ≤ N ≤ 20,000) 둘째 줄부터 N개의 줄에 걸쳐 알파벳 소문자로 이루어진 단어가 한 줄에 하나씩 주어진다. 주어지는 문자열의 길이는 50을 넘지 않는다.

출력

조건에 따라 정렬하여 단어들을 출력한다.

예제 입력 1 

13
but
i
wont
hesitate
no
more
no
more
it
cannot
wait
im
yours

예제 출력 1 

i
im
it
no
but
more
wait
wont
yours
cannot
hesitate

 

 

풀이

import java.io.*;
import java.util.*;

public class Main {

    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        StringBuilder sb = new StringBuilder();
        int n = Integer.parseInt(br.readLine());
        String[] words = new String[n];

        for(int i = 0; i < n; i++){
            words[i] = br.readLine();

        }

        words = Arrays.stream(words)
            .distinct()
            .sorted(
                Comparator.comparingInt(String::length)
            .thenComparing(String::compareTo))
            .toArray(String[]::new);
        ;


        for(String word : words){
            sb.append(word+"\n");
        };
        System.out.println(sb.toString());
    }
}

 

 

성능에 대하여 (최적화 가능성)

1. distinct()의 비용

Stream에서의 distinct()는 내부적으로 아래와 같은 구조로 동작

HashSet<String> seen = new HashSet<>();

 

  • 모든 문자열을 해시 계산
  • Set에 넣고 존재 여부 확인
  • O(N) 이지만 문자열 해시 + 메모리 접근 비용이 큼

 

Stream의 Comparator 호출 구조

Stream sorted()는 내부적으로:

  • 컬렉션 변환 → 정렬 → 재수집
  • 람다 캡처(람다가 자기 바깥에 있는 변수를 들고 들어가는 것) -> 객체 생성 -> JVM 최적화 어려움 
  • 함수 객체 호출 비용 증가 
Stream
 └─ SortedOp
     └─ Sink
         └─ Comparator.compare()

 

-> Arrays.sort로 대체 가능

Arrays.sort 는 “배열 전용 최적화”가 되어 있음

 

Arrays.sort(Object[])

  • TimSort
  • 배열 전용
  • 추가 복사 최소화
  • 캐시 효율 좋음

Stream의 sorted()는:

  • 컬렉션 변환 → 정렬 → 재수집
  • 배열에 비해 우회 경로가 많음
6uiw
@6uiw :: LOG.INFO("MING's DEVLOG")

개발을 하면서 공부한 기록을 남깁니다

목차