정렬(선택 정렬, 삽입 정렬, 퀵 정렬, 계수 정렬)

Python

정렬(선택 정렬, 삽입 정렬, 퀵 정렬, 계수 정렬)

수줌이 2021. 2. 28. 19:16

정렬(sorting)이란?

데이터를 특정한 기준에 따라서 순서대로 나열하는 것
정렬 알고리즘의 종류에는 선택 정렬, 삽입 정렬, 퀵 정렬, 계수 정렬이 있다.

* 여기서 다루는 예제는 모두 오름차순 정렬을 수행한다고 가정하자 !

1. 선택 정렬(selection sort)

매번 '가장 작은 것을 선택한다.' 는 의미의 알고리즘
가장 작은 데이터를 앞으로 보내는 과정을 N-1번 반복하면 정렬이 완료된다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range (len(array)):
  min_index = i # 가장 작은 원소의 인덱스
  
  for j in range(i+1,len(array)):
    if array[min_index] > array[j]:
      min_index = j
      
  array[i], array[min_index] = array[min_index], array[i] # 스와프

print(array)

* 여기서 스와프란 특정한 리스트가 주어졌을 때 두 변수의 위치를 변경하는 작업을 의미한다.

# 스와프
array = [3,5]

array[0],array[1] = array[1],array[0]

print(array)

* 선택정렬을 이용하는 경우, 데이터의 개수가 10,000개 이상이면 정렬 속도가 급격히 느려진다.

현재 데이터의 상태와 상관없이 무조건 모든 원소를 비교하고 위치를 바꾼다.

2. 삽입 정렬(insertion sort)

'데이터를 하나씩 확인하며, 각 데이터를 적절한 위치에 삽입하면 어떨까?'
선택 정렬에 비해 실행 시간 측면에서 더욱 효율적이다.
필요할 때만 위치를 바꾸므로 '데이터가 거의 정렬되어 있을 때' 훨씬 효율적이다.
특정한 데이터가 적절한 위치에 들어가기 이전에, 그 앞까지의 데이터는 이미 정렬되어 있다고 가정한다.
정렬이 이루어진 원소는 항상 오름차순을 유지하고 있다는 점이 있다.
이러한 특징 때문에 특정한 데이터가 삽입될 위치를 선정할 때 삽입될 데이터보다 작은 데이터를 만나면 그 위치에서 멈추면 된다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range (len(array)):
  for j in range(i, 0, -1): # 인덱스 i부터 1까지 감소하며 반복
    if array[j] < array[j-1]: # 한 칸씩 왼쪽으로 이동
      array[j], array[j-1] = array[j-1], array[j]
    else : # 자기보다 작은 데이터를 만나면 그 위치에서 멈춤
      break

print(array)

* 삽입 정렬은 현재 리스트의 데이터가 거의 정렬되어 있는 상태라면 매우 빠르게 동작한다는 것을 기억하자 !!

3. 퀵 정렬

'기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸면 어떨까?'
큰 숫자와 작은 숫자를 교환할 때, 교환하기 위한 기준을 피벗(pivot)이라 하는데 퀵 정렬에서는 피벗이 사용된다.
재귀 함수 형태로 작성했을 때 구현이 매우 간결해진다.
재귀 함수랑 동작 원리가 같다면 종료 함수도 있어야 한다. 퀵 정렬이 끝나는 조건은 현재 리스트의 데이터가 1개인 경우이다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
  if start >= end: # 원소가 1개인 경우 종료
    return
  pivot = start # 피벗은 첫 번째 원소
  left = start +1
  right = end
  
  while left <= right:
    # 피벗보다 큰 데이터를 찾을 때까지 반복 
    while left <= end and array[left] <= array[pivot]:
      left += 1
    # 피벗보다 작은 데이터를 찾을 때까지 반복
    while right > start and array[right] >= array[pivot]:
      right -= 1
    if left > right: # 엇갈렸다면 작은 데이터와 피벗을 교체
      array[right], array[pivot] = array[pivot],array[right]
    else : # 엇갈리지 않았다면 작은 데이터와 큰 데이터 교체
       array[left], array[right] = array[right],array[left]
          
  # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
  quick_sort(array, start, right-1)
  quick_sort(array, right + 1, end)

quick_sort(array, 0, len(array) -1)
print(array)

* 퀵 정렬은 위에 소개했던 두 개의 정렬 방식에 비해 매우 빠른 편이다. 하지만 '이미 데이터가 정렬되어 있는 경우' 에는 매우 느리게 동작한다.

4. 계수 정렬(count sort)

특정한 조건이 부합할 때만 사용할 수 있다. (매우 빠른 알고리즘)
'데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때'만 사용 가능
가장 큰 데이터와 가장 작은 데이터의 차이가 너무 크다면 계수 정렬은 사용할 수 없다.
계수 정렬은 위의 3가지 알고리즘처럼 직접 데이터 값을 비교한 뒤 위치를 변경하며 정렬하는 방식이 아니다.
별도의 리스트를 선언하고 그 안에 정렬에 대한 정보를 담는다는 특징이 있다.
데이터의 크기가 한정되어 있고 데이터의 크기가 많이 중복되어 있을수록 유리하며, 항상 사용할 수는 없다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8, 0, 5, 2]

# 모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)

for i in range(len(array)):
  count[array[i]] += 1 # 각 데이터에 해당하는 인덱스의 값 증가

for i in range(len(count)): # 리스트에 기록된 정렬 정보 확인
  for j in range(count[i]):
    print(i, end = ' ') # 띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력

* 퀵 정렬은 일반적인 경우에서 평균적으로 빠르게 동작하므로 데이터의 특성을 파악하기 어렵다면 퀵 정렬을 이용하자 !!

이 글은 "이것이 코딩 테스트다" 에서 배운 내용을 정리하여 작성하였습니다.