이 글에서는 엑셀 FREQUENCY 함수: 데이터 빈도 분석, 히스토그램 만들기에 대해 알아봅니다. 엑셀의 FREQUENCY 함수를 사용하여 데이터 빈도를 분석하고 히스토그램을 만드는 방법을 알려드리겠습니다. FREQUENCY 함수는 데이터가 특정 구간에 얼마나 자주 나타나는지 계산하는 데 유용하며, 이를 통해 데이터 분포를 시각적으로 파악할 수 있습니다. 함께 따라 하시면 데이터 분석 능력을 향상시키는 데 도움이 될 것입니다.
엑셀 FREQUENCY 함수: 데이터 빈도 분석, 히스토그램 만들기
FREQUENCY 함수란 무엇인가요?
FREQUENCY 함수는 데이터 집합에서 특정 구간(Bins)에 속하는 값들의 개수(빈도)를 계산하는 데 사용됩니다. 이 함수는 배열 함수이기 때문에 결과값이 여러 셀에 걸쳐 표시됩니다. 히스토그램을 만들거나 데이터의 분포를 분석할 때 유용하게 활용할 수 있습니다.
FREQUENCY 함수의 구문
excel
FREQUENCY(data_array, bins_array)
- data_array: 빈도를 계산할 데이터가 포함된 범위입니다.
- bins_array: 구간의 경계값을 포함하는 배열 또는 범위입니다. bins_array의 값들은 오름차순으로 정렬되어야 합니다.
FREQUENCY 함수 사용 예시
데이터: 학생 20명의 시험 점수가 다음과 같다고 가정해봅시다.
75, 82, 90, 65, 78, 88, 95, 70, 85, 92, 68, 72, 80, 91, 76, 83, 89, 60, 79, 87
목표: 60점 미만, 60점 이상 70점 미만, 70점 이상 80점 미만, 80점 이상 90점 미만, 90점 이상의 구간별 학생 수를 계산하고 싶습니다.
1. Bins_array 설정: 새로운 열에 구간의 경계값을 입력합니다. (예: 60, 70, 80, 90)
2. FREQUENCY 함수 입력: 빈도를 표시할 셀 범위를 선택하고 다음과 같이 FREQUENCY 함수를 입력합니다. 결과가 표시될 셀의 개수는 bins_array의 개수보다 하나 더 많아야 합니다. 마지막 셀에는 bins_array의 마지막 값보다 큰 값들의 개수가 표시됩니다.
excel
=FREQUENCY(데이터 범위, 구간 범위)
예를 들어 데이터 범위가 A1:A20이고, 구간 범위가 C1:C4라면, D1:D5 셀을 선택하고 =FREQUENCY(A1:A20, C1:C4)
를 입력합니다. 입력 후 Ctrl + Shift + Enter 키를 눌러 배열 함수로 입력해야 합니다.
3. 결과 확인:
| 구간 | 빈도 |
|———–|——|
| 60 미만 | 1 |
| 60 ~ 70 | 2 |
| 70 ~ 80 | 6 |
| 80 ~ 90 | 7 |
| 90 이상 | 4 |
FREQUENCY 함수와 히스토그램
FREQUENCY 함수의 결과를 이용하여 히스토그램을 쉽게 만들 수 있습니다. 위의 예시에서 구간과 빈도 데이터를 이용하여 막대 그래프를 그리면 시험 점수의 분포를 시각적으로 확인할 수 있습니다.
FREQUENCY 함수 사용 시 주의사항
- FREQUENCY 함수는 배열 함수이므로, 수식 입력 후 Ctrl + Shift + Enter 키를 눌러 입력해야 합니다.
- bins_array 값은 오름차순으로 정렬되어야 합니다.
- 결과 범위의 크기는 bins_array의 크기보다 하나 더 커야 합니다. 마지막 값은 bins_array의 최댓값보다 큰 모든 데이터의 개수를 포함합니다.
이처럼 FREQUENCY 함수는 데이터 분석 및 시각화에 매우 유용한 도구입니다. 다양한 데이터에 적용하여 데이터의 분포와 특징을 파악해 보세요.
엑셀 FREQUENCY 함수: 데이터 빈도 분석, 히스토그램 만들기 (계속)
FREQUENCY 함수 활용: 조건부 빈도 분석
FREQUENCY 함수는 단순히 숫자 데이터뿐만 아니라 조건을 추가하여 특정 조건을 만족하는 데이터의 빈도를 계산할 수도 있습니다. 이를 통해 더욱 세분화된 데이터 분석이 가능합니다.
예시: 위의 학생 시험 점수 예시에 추가로 각 학생의 성별 데이터가 있다고 가정해 봅시다. 남학생과 여학생의 점수 분포를 따로 확인하고 싶을 때 조건부 빈도 분석을 활용할 수 있습니다.
데이터:
| 점수 | 성별 |
|—|—|
| 75 | 남 |
| 82 | 여 |
| 90 | 남 |
| 65 | 여 |
| … | … |
목표: 남학생과 여학생의 점수 구간별 빈도 계산 (60점 미만, 60~70, 70~80, 80~90, 90점 이상)
1. 데이터 필터링: FILTER
함수를 사용하여 남학생과 여학생의 점수 데이터를 각각 추출합니다. 예를 들어 성별 데이터가 B열에 있다면, 남학생 점수는 =FILTER(A1:A20, B1:B20="남")
, 여학생 점수는 =FILTER(A1:A20, B1:B20="여")
와 같이 추출할 수 있습니다. 이때 추출된 데이터는 임시적으로 다른 열(예: D열, E열)에 저장합니다.
2. FREQUENCY 함수 적용: 이전 예시와 동일하게 구간 경계값(60, 70, 80, 90)을 설정하고, FREQUENCY
함수를 사용하여 남학생과 여학생 점수 데이터의 구간별 빈도를 계산합니다. 남학생 점수 빈도는 =FREQUENCY(D1:D20, C1:C4)
(D열이 남학생 점수 데이터라고 가정), 여학생 점수 빈도는 =FREQUENCY(E1:E20, C1:C4)
(E열이 여학생 점수 데이터라고 가정)와 같이 계산합니다. 역시 Ctrl + Shift + Enter 를 눌러 배열 함수로 입력해야 합니다.
3. 결과 분석: 계산된 빈도를 통해 남학생과 여학생의 점수 분포를 비교 분석할 수 있습니다. 예를 들어 막대 그래프로 시각화하면 각 성별의 점수 분포 차이를 더욱 명확하게 파악할 수 있습니다.
FREQUENCY 함수의 다양한 응용
FREQUENCY 함수는 다양한 방식으로 응용될 수 있습니다. 몇 가지 예시를 살펴보겠습니다.
- 특정 값의 개수 세기: bins_array에 특정 값 하나만 입력하면 해당 값과 같은 데이터의 개수를 계산할 수 있습니다.
- 중복 데이터 제거: FREQUENCY 함수를 이용하여 중복된 데이터를 식별하고 제거할 수 있습니다. 빈도가 1보다 큰 값은 중복된 데이터임을 나타냅니다.
- 데이터 순위 분석: FREQUENCY 함수와
RANK
함수를 함께 사용하면 데이터의 순위를 분석하는 데 활용할 수 있습니다.
FREQUENCY 함수를 사용한 효율적인 데이터 분석
FREQUENCY 함수는 간단하지만 강력한 데이터 분석 도구입니다. 데이터의 분포를 파악하고, 조건부 분석을 수행하며, 다양한 통계적 정보를 얻는 데 유용하게 활용할 수 있습니다. 위의 예시와 설명을 통해 FREQUENCY 함수를 더욱 효율적으로 활용하여 데이터 분석 능력을 향상시켜 보세요.
이 글에서는 엑셀 FREQUENCY 함수: 데이터 빈도 분석, 히스토그램 만들기에 대해 알아보았습니다. 감사합니다.