문제
알파벳 소문자로 이루어진 N개의 단어가 들어오면 아래와 같은 조건에 따라 정렬하는 프로그램을 작성하시오.
- 길이가 짧은 것부터
- 길이가 같으면 사전 순으로
단, 중복된 단어는 하나만 남기고 제거해야 한다.
입력
첫째 줄에 단어의 개수 N이 주어진다. (1 ≤ N ≤ 20,000) 둘째 줄부터 N개의 줄에 걸쳐 알파벳 소문자로 이루어진 단어가 한 줄에 하나씩 주어진다. 주어지는 문자열의 길이는 50을 넘지 않는다.
출력
조건에 따라 정렬하여 단어들을 출력한다.
예제 입력 1
13
but
i
wont
hesitate
no
more
no
more
it
cannot
wait
im
yours
예제 출력 1
i
im
it
no
but
more
wait
wont
yours
cannot
hesitate
풀이
import java.io.*;
import java.util.*;
public class Main {
public static void main(String[] args) throws IOException {
BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
StringBuilder sb = new StringBuilder();
int n = Integer.parseInt(br.readLine());
String[] words = new String[n];
for(int i = 0; i < n; i++){
words[i] = br.readLine();
}
words = Arrays.stream(words)
.distinct()
.sorted(
Comparator.comparingInt(String::length)
.thenComparing(String::compareTo))
.toArray(String[]::new);
;
for(String word : words){
sb.append(word+"\n");
};
System.out.println(sb.toString());
}
}
성능에 대하여 (최적화 가능성)
1. distinct()의 비용
Stream에서의 distinct()는 내부적으로 아래와 같은 구조로 동작
HashSet<String> seen = new HashSet<>();
- 모든 문자열을 해시 계산
- Set에 넣고 존재 여부 확인
- O(N) 이지만 문자열 해시 + 메모리 접근 비용이 큼
Stream의 Comparator 호출 구조
Stream sorted()는 내부적으로:
- 컬렉션 변환 → 정렬 → 재수집
- 람다 캡처(람다가 자기 바깥에 있는 변수를 들고 들어가는 것) -> 객체 생성 -> JVM 최적화 어려움
- 함수 객체 호출 비용 증가
Stream
└─ SortedOp
└─ Sink
└─ Comparator.compare()
-> Arrays.sort로 대체 가능
Arrays.sort 는 “배열 전용 최적화”가 되어 있음
Arrays.sort(Object[])
- TimSort
- 배열 전용
- 추가 복사 최소화
- 캐시 효율 좋음
Stream의 sorted()는:
- 컬렉션 변환 → 정렬 → 재수집
- 배열에 비해 우회 경로가 많음
'Coding Test > 백준 - JAVA' 카테고리의 다른 글
| 백준 1620번 나는야 포켓몬 마스터 이다솜 (JAVA) (1) | 2026.01.23 |
|---|---|
| 백준 11651번 좌표 정렬하기2 (0) | 2026.01.15 |
| 백준 11650번 좌표 정렬하기(JAVA) (0) | 2026.01.04 |
| 백준 2751번 수 정렬하기2 (JAVA) (2) | 2025.03.03 |
| 백준 25305번 커트라인 (JAVA) (0) | 2025.02.26 |