스프레드시트에서 문자열을 쉽게 다루는 방법: MID 함수 완벽 가이드

스프레드시트에서 문자열을 쉽게 다루는 방법: MID 함수 완벽 가이드

2024. 10. 15. 23:47ㆍ카테고리 없음

MID 함수는 엑셀이나 구글 스프레드시트와 같은 스프레드시트 소프트웨어에서 문자열의 중간에서 지정된 수만큼 문자를 추출하는 기능을 가진 매우 유용한 함수입니다. 이 함수는 특정 위치에서 원하는 길이만큼의 텍스트를 손쉽게 가져올 수 있어, 텍스트 데이터를 처리하거나 분석할 때 매우 효율적인 도구로 사용됩니다. 주로 데이터 전처리 작업에서, 텍스트 데이터의 일부분을 추출할 때 또는 문자열을 나눌 때 많이 사용됩니다.

함수의 일반적인 형태는 다음과 같습니다:

=MID(텍스트, 시작위치, 추출할문자수)

여기서 각 인수는 다음과 같은 의미를 가집니다:

텍스트: 문자를 추출할 대상 문자열을 의미합니다. 이는 일반적으로 따옴표로 묶인 텍스트이거나 셀 참조로 입력됩니다.
시작위치: 추출을 시작할 위치를 지정하는 값으로, 이 값은 1부터 시작합니다. 첫 번째 문자는 위치 1로 계산되며, 두 번째 문자는 위치 2, 이런 식으로 쭉 이어집니다.
추출할문자수: 추출하고자 하는 문자 수를 지정하는 값으로, 지정된 위치에서 시작하여 이 숫자만큼의 문자를 반환합니다.

예시로 보는 MID 함수

예를 들어, 문자열 "ChatGPT is amazing"에서 "GPT"라는 단어를 추출하고 싶다고 가정해 보겠습니다. 이때 MID 함수를 사용하여 "GPT" 부분만 추출하려면 아래와 같은 수식을 사용할 수 있습니다:

=MID("ChatGPT is amazing", 5, 3)

이 수식에서 각 인수는 다음과 같이 해석됩니다:

텍스트: "ChatGPT is amazing"이라는 전체 문자열에서 문자를 추출합니다.
시작위치: "GPT"의 첫 번째 글자인 "G"는 다섯 번째 문자이므로 시작위치를 5로 지정합니다.
추출할문자수: "GPT"는 3글자로 이루어져 있으므로 추출할 문자의 수를 3으로 설정합니다.

이 함수는 결과적으로 "GPT"라는 문자열을 반환합니다.

다양한 예시로 보는 MID 함수의 활용도

1. 특정 부분만 추출하기

문자열 "abcdefg"에서 "cde"라는 부분만 추출하고 싶다면, 다음과 같은 방법으로 MID 함수를 적용할 수 있습니다.

=MID("abcdefg", 3, 3)

이 수식은 세 번째 문자에서 시작하여 3글자를 추출합니다. 결과는 "cde"가 됩니다. 이렇게 간단한 방식으로 특정 문자열의 일부분을 손쉽게 추출할 수 있습니다.

2. 문자열 길이 계산과 함께 사용하기

MID 함수를 LEN 함수와 결합하여, 문자열의 중간부터 끝까지의 텍스트를 추출할 수도 있습니다. 예를 들어, "abcdefg"라는 문자열에서 중간부터 끝까지 모든 문자를 추출하고 싶다면 다음과 같은 수식을 사용할 수 있습니다:

=MID("abcdefg", 3, LEN("abcdefg") - 2)

이 수식의 결과는 "cdefg"가 됩니다. 여기서 LEN("abcdefg")는 문자열의 전체 길이인 7을 반환하며, 이를 이용하여 전체 문자열에서 앞의 두 글자를 제외한 나머지 부분을 추출할 수 있습니다. LEN 함수는 문자열의 길이를 구하는 함수로, MID 함수와 함께 사용할 때 유용한 조합을 이룹니다.

실생활에서의 MID 함수 응용

1. 이름과 성 구분하기

한국어나 다른 언어로 된 이름을 처리할 때, MID 함수를 활용하여 이름과 성을 분리할 수 있습니다. 예를 들어 "홍길동"이라는 이름이 있다고 가정하면, MID 함수를 사용하여 성인 "홍"을 분리한 후 나머지 부분인 "길동"을 따로 추출할 수 있습니다. 이를 위해 LEFT, RIGHT, FIND 함수와 조합하여 더욱 복잡한 문자열 처리 작업을 수행할 수도 있습니다.

2. 문서 코드 분석

서류나 제품 번호 같은 코드에서 특정 부분만 추출해야 할 경우, MID 함수는 매우 유용합니다. 예를 들어, 제품 번호가 "PRD-2024-001"과 같은 형식으로 이루어져 있을 때, 연도인 "2024" 부분만 추출하고 싶다면 MID 함수를 사용하여 간단하게 이 부분만 가져올 수 있습니다.

=MID("PRD-2024-001", 5, 4)

이 수식을 사용하면 "2024"라는 결과를 얻을 수 있습니다. 이처럼 규칙적인 형식의 코드에서 특정 구간을 추출하는 데 매우 효과적입니다.

3. 데이터 전처리 작업에서의 활용

대규모 데이터 세트에서 특정 패턴을 가진 문자열을 추출하는 작업은 흔한 데이터 전처리 과정입니다. 예를 들어, 고객의 이메일 주소 중 도메인 이름만 추출하거나, 전화번호에서 지역 코드만 따로 추출해야 하는 경우에도 MID 함수는 큰 도움이 됩니다. 이를 통해 데이터를 효율적으로 분석하고 가공할 수 있습니다.

MID 함수 사용 시 유의할 점

MID 함수를 사용할 때 몇 가지 유의해야 할 사항이 있습니다.

시작위치가 1보다 작으면 오류가 발생합니다. MID 함수의 시작위치는 항상 1 이상이어야 합니다. 만약 0이나 음수 값을 입력하면 #VALUE! 오류가 발생합니다.
추출할 문자의 수가 실제 문자열의 길이를 초과할 경우, 시작위치 이후 남은 문자만 반환됩니다. 예를 들어, "abcdefg"라는 문자열에서 다섯 번째 위치부터 10글자를 추출하려고 할 때, 실제로는 다섯 번째 위치 이후 남은 문자들인 "efg"만 반환됩니다. 엑셀은 이 상황을 오류로 처리하지 않으며, 가능한 만큼의 문자를 반환하게 됩니다.
공백 포함 여부: 문자열에 공백이 포함된 경우에도 공백은 하나의 문자로 처리됩니다. 예를 들어, "Hello World"에서 공백을 포함하여 추출하려는 경우, 시작 위치와 문자의 수를 공백을 고려해 설정해야 합니다.

결론

MID 함수는 문자열의 중간에서 필요한 만큼의 문자를 손쉽게 추출할 수 있는 매우 강력한 도구입니다. 특히 데이터 전처리 과정에서 필수적으로 사용되며, 대량의 텍스트 데이터에서 필요한 부분만을 추출하여 분석할 때 유용하게 활용됩니다. 또한 LEN, LEFT, RIGHT와 같은 다른 텍스트 함수와 조합하여 더욱 복잡한 문자열 처리 작업을 수행할 수 있습니다. 실생활에서도 제품 코드, 문서 번호, 이름 구분 등 다양한 상황에서 활용 가능하므로, 엑셀이나 구글 스프레드시트를 사용하는 사용자에게 꼭 필요한 함수라고 할 수 있습니다.

디디디디01