고객 사례

머신러닝 이론의 실제 구현

성균관대학교 정보과학연구실(InfoScience Lab)은 JMP®의 통계방법을 사용하여 산업 분야 고객을 위한 맞춤형 머신러닝 방법론을 적용합니다. 그중에서도 한국을 대표하는 철강 제조업체인 POSCO와의 협력 사례를 소개합니다.

성균관대학교

과제산업 분야에서 머신러닝 이니셔티브를 구현하려는 노력을 약화시킨 주된 원인은 인공지능(AI) 개발 중 통계적인 측면의 투자에 소흘했기 때문입니다. 또한 학생을 비롯한 스마트 제조 분야의 다른 비전문가들은 알고리즘의 토대가 되는 데이터과학 관련 지식이 부족하다는 한계를 갖고 있습니다.
해결책성균관대학교의 교수진과 학생들은 선도적인 산업용 소프트웨어 JMP를 사용하여 머신러닝 방법론을 적용하고 이를 통해 제조 산업의 과제들을 성공적으로 해결합니다. JMP는 사용자 친화적인 인터페이스를 바탕으로 쉽고 편한 데이터마이닝과 데이터 탐색을 제공하며, 학계와 산업 간의 파트너십과 협업을 촉진합니다.
결과성균관대학교 정보과학연구실에서는 JMP를 이용해 머신러닝 기술을 적용함으로써 산업 클라이언트의 비용 및 시간을 크게 절감하는 효과를 얻고 있습니다. 일례로 한국의 유명 철강 제조업체 POSCO는 이 팀의 노력으로 라인당 연간 수억 원의 비용을 절약했습니다. 이종석 교수는 코딩 중심의 R 또는 Python 대신 JMP를 사용함으로써 이전 같으면 완료까지 한 달은 소요되었을 일을 단 1주 만에 마칠 수 있었다고 설명합니다.

인공지능(AI)에 대한 전세계 기업과 정부의 투자가 증가하면서 이 새로운 기술을 성공적으로 적용하기 위한 경쟁이 시작되었습니다. 이러한 투자 동향과 그에 따른 관심 증가에도 불구하고 아직까지 많은 조직들은 전면적인 AI 시스템의 실제 구현을 위한 초기 단계에 머무르고 있습니다. 전문가들은 AI의 미래가 여러가지 이유, 그 중에서도 통계 방법에 대한 이해 부족으로 인해 어느 정도 제약을 받고 있다는 데 동의합니다.

머신러닝 전문가이자 성균관대학교 교수인 이종석 박사는 “최근 AI에 대한 관심이 높아지면서 학생이나 현업에서 이에 대한 환상을 갖는 것 같습니다. 그러면서 데이터 분석에서 기초의 중요성이 간과되는 것 같아 아쉽습니다."라고 말합니다.

이 교수는 AI에 대한 지나친 기대로 실무자나 학생들이 통계와 기반 기술을 이해하려는 노력을 소흘히 하는 것을 안타까워 합니다. 그는 기초 과학에 더욱 초점을 맞춤으로써 조직이 기술의 이점을 더 잘 활용할 수 있게 된다고 말합니다. 머신러닝은 컴퓨터 시스템을 '학습'시킬 수 있는 알고리즘 개발에 중점을 두는 AI의 부분 집합으로, 경쟁력 유지를 위해 자동화가 필요한 오늘날의 제조 환경에서 혁신적인 잠재력을 갖고 있습니다.

반도체, 자동차, 전자제품 산업이 발전한 한국은 AI와 머신 러닝 분야에서 세계적인 리더가 될 수 있는 역량이 충분합니다. 지난 5년 동안 한국 정부는 기술 개발을 위한 대규모 투자를 아끼지 않았으며, 한국을 대표하는 기업인 삼성, LG, 현대는 AI 운영 생태계 구축을 위한 공격적인 목표를 수립했습니다.

이 교수가 정보과학연구실을 이끌고 있는 성균관대학교는 AI 기술 개발과 적용에 있어 두드러진 활약을 보이고 있습니다. 서울 중심부에 위치한 성균관대학교는 조선 왕조가 건립된 14세기부터 시작되는 오랜 역사를 자랑합니다. 600년 전에 세워진 이 학교는 우수한 인재 양성은 물론 과학 연구 분야의 성과 모두에서 큰 업적을 달성했습니다.

오늘날 성균관대학교는 삼성과의 긴밀한 파트너십과 협업으로 매년 훌륭한 산업 인재를 배출하고 있습니다. 산업 파트너와의 긴밀한 협력은 통계 연구와 학습 증진에도 큰 도움을 주고 있으며 이는 AI 시스템의 소프트웨어와 하드웨어 분야를 모두 선도하고 있는 삼성에 필요한 역량이기도 합니다.

AI 발전을 위해 우선적으로 필요한 연구원들의 기초 역량

성균관대학교의 정보과학연구실은 학생들을 학습 프로그램, 연구 및 데이터 마이닝, 비즈니스 분석, 운영 분석과 관련된 실제 비즈니스 문제를 다루는 컨설팅 프로젝트에 참여시킴으로써 획기적인 산학 협력 관계를 활용하고 있습니다. 이 교는 그러나 이러한 흥미로운 응용 분야를 이끌기 위해 실제로 중점을 두어야 하는 것은 AI의 통계적 근원으로 돌아가는 것이라고 설명합니다.

그는 “데이터가 무엇을 뜻하는지 정확히 이해해야 올바른 알고리즘을 선택하고 적용할 수 있습니다. 머신러닝에 대한 현재의 유행이 지나가고 나면 사람들은 결국 기본으로 돌아가게 될 것이라고 생각합니다."라고 말하며 사람들이 AI의 근간이 되는 방법론적 토대 없이 성급하게 AI에 대한 큰 그림을 그리고 있다고 말합니다.

이 교수는 데이터 마이닝과 머신러닝 방법론 전문가로서 조직이 보다 근거에 기반한 의사 결정을 내리는 데 도움을 주기 위한 연구 활동을 이끌어 왔습니다. 현재도 그와 그의 팀은 최적의 운영 구현을 위해 '제조 AI'라는, 프로세스를 지능적으로 결정하는 알고리즘을 개발하고 있습니다. 이러한 적용은 제조 분야에서 결함을 식별하는 데 사용되는 불균형 데이터 분류라는 오래된 문제를 해결하는 데 그 목적이 있습니다.

이 교수는 최근 머신 러닝 분야의 한 주제로, 한 가지 문제를 해결하여 얻은 통찰력을 저장했다가 다른 시스템에 적용하기 위한 전이 학습(transfer learning)에도 관심을 갖고 있습니다. 오늘날 지식 이전을 위한 가장 일반적인 산업 응용 프로그램은 영상 인식에 기초한 예방 정비 분야입니다. 즉 이 교수는 공장 정비 이전에 생성된 머신 러닝 모델이 거의 즉시 정비 내용을 반영하여 업데이트될 수 있다고 설명합니다.

이 교수와 그의 연구팀이 에너지를 쏟을 대상의 우선 순위를 정하기 위해서는 프로젝트의 잠재적인 산업 응용 분야를 이해해야 합니다. 또한 많은 프로젝트는 산업 현장에서 직접 나타납니다. 이 교수는 "저의 목표는 기업 프로젝트 현장에서 얻은 제 경험을 토대로 학생들이 최대한 배울 수 있도록 돕는 것입니다."라고 말합니다.

이 교수와 학생들이 가장 많이 의존하는 도구 중 하나가 JMP의 통계적 발견 소프트웨어입니다. 이 프로그램은 많은 산업 리더가 사용하는 패키지이기도 합니다. JMP는 학생들의 통계 학습에 도움을 줄 뿐만 아니라 산업 데이터 집합 연구와 모형 구축을 쉽게 연습할 수 있도록 해줍니다. 대화식 데이터 시각화로 데이터 특성을 빠르고 쉽게 식별할 수 있으며 사용자 지정 가능한 스크립트로 전문 사용자가 반복적인 작업을 자동화하여 분석 시간을 단축할 수 있습니다.

이 교수는 "처음 JMP에서 데이터 테이블의 열 속성 기능을 보고 많이 놀랐습니다. 너무나 혁신적이었기 때문입니다. 그래프와 데이터 선택 간의 교호작용 또한 차별화 요인입니다."라고 말합니다.


"JMP는 작업 시간을 극적으로 줄여주었습니다. R을 사용했다면 작업을 마치는 데 1개월이 걸렸을 것입니다. 그러나 JMP를 사용하면서 일주일 내에 작업을 마칠 수 있었습니다."

– 이종석 교수

철강 제조업체 POSCO는 머신 러닝 응용 프로그램으로 라인당 비용을 연간 수십만 달러 절약하고 있습니다.

이 교수의 가장 눈에 띄는 성과는 한국 포항에 본사를 두고 있는 철강 제조업체, POSCO International과의 최근 협업이었습니다. 수천 톤의 원유 소비로 세계에서 네 번째로 큰 철강 제조업체인 POSCO는 초기에 스마트 제조 방식을 채택했으며 AI 시스템에도 많은 투자를 해왔습니다. 그러한 투자의 일부는 이 교수와 같은 통계 전문가를 영입하는 데 할애되었으며 이는 2019년 세계 경제 포럼에서 POSCO가 “산업을 등대처럼 밝히는 라이트하우스(lighthouse)” 제조업체로 선정되는 성과로 이어졌습니다.

이 교수는 POSCO가 강철 도금 설비와 관련된 공정 제어 문제에 직면한 상황에서 그 문제를 영구적으로 해결할 수 있는 머신 러닝 응용 프로그램 개발을 위해 영입되었습니다. POSCO의 도금 공정에는 소위 '에어 나이프(air knife)'라고 하는 고압 공기를 목표 용적에 맞게 강판에 분사하는 작업이 포함됩니다. 또한 이 공정에서는 에어 나이프와 도금면 사이의 거리와 공기 압력을 모두 제어해야 합니다. 공기 흐름 제어는 도금조 바로 위에서 수행되지만 도금 용적을 측정하는 게이지는 200m 떨어진 곳에 위치합니다. 이러한 차이로 인해 측정 시간의 차이와 함께 머신 러닝 예측의 기회 공백이 발생합니다.

이 교수는 “우리의 과제는 도판이 게이지쪽으로 200m 이동하기 전 라인 속도와 같은 여러 변수를 기반으로 적절한 공기 흐름 조건을 계산하는 것이었습니다."라고 설명합니다. “하루 24시간 가동되는 연속 공정에서 품질 특성을 달성하기 위해서는 피드백이 아닌 선제적인 예방 조치가 필요했습니다.”

공정 제어 자체는 표준 모니터링 공정에서 발견된 잘못을 시정하기 위한 피드백 방법으로 시작되며 머신 러닝은 그 다음 논리적 단계입니다. “머신 러닝의 핵심은 과거 데이터에서 얻은 정보를 토대로 미래를 예측하는 것입니다. 따라서 머신 러닝 응용 프로그램에 대한 세부적인 분석 이전에 성균관대학교 연구팀의 첫 번째 작업은 추세 및 기타 정보를 얻기 위해 공장의 과거 데이터를 탐색하는 것이었습니다.

“우리는 탐색적 데이터 분석을 위해 항상 JMP를 사용합니다. JMP를 사용하면 분포를 확인하고 산점도 행렬을 사용하여 관련성을 식별하며 이상치를 확인하는 작업까지 빠르고 쉽게 처리할 수 있습니다. 물론 이 모든 작업에서 어떤 코딩도 필요하지 않습니다."라고 이 교수는 설명합니다.

이 교수와 연구팀은 통찰력을 얻기 위한 기존 데이터 마이닝 작업을 마친 후 반응 표면 최적화를 실시간으로 실행하는 알고리즘을 개발했습니다. 이 알고리즘은 공정 데이터를 활용하여 관리 요인 및 도금 용적과 JMP 신경망 간의 관계를 학습합니다. 또한 학습된 도금 예측 모형과 목표 간의 손실 함수를 정의, 최소화하고 에어 나이프 압력과 측정 차이를 실시간으로 계산합니다.

이 교수는 “JMP를 사용함으로써 예측성이 우수한 모형을 빠르게 찾고 판단할 수 있었습니다. 프로파일러의 만족도 기능을 사용했으며 모형에서 얻은 결과를 토대로 고객과 함께 빠르게 방법을 공유, 설정할 수 있었습니다.”라고 말합니다.

연구팀은 도금 시스템의 편차를 줄이고 보다 정확한 제어 장치를 마련했으며 그에 따라 설비를 목표에 보다 근접하게 운영함으로써 버려지는 아연의 양을 크게 줄일 수 있었습니다. 이 교수는 이 프로젝트를 통해 POSCO가 라인당 연간 수억원(미화 수십만 달러)의 비용을 절감할 수 있게 되었다고 말합니다.

AI 구현으로 가는 길은 분석의 문화로 시작됩니다

이 교수는 연구의 시작점을 데이터로 삼지 않았다면 POSCO의 머신 러닝 구현이 불가능했을 것이라고 말합니다. 최적의 알고리즘을 개발할 수 있었던 것은 탐색적 분석을 수행했기 때문입니다. 그러나 POSCO는 매우 선구자적인 기업입니다. 다른 기업이 아직까지도 큰 꿈만 꾸고 역량은 부족한 상황에서 이미 특정 AI 응용 프로그램을 구현했기 때문입니다.

이 교수는 “POSCO는 많은 측면에서 다른 기업들보다 몇 년은 더 앞서 있습니다. 가장 큰 이점은 데이터 소유권이 단일 전담 조직에 집중되어 있다는 것입니다. 다른 기업의 경우 데이터가 일반적으로 여러 부서에 분산되어 있어 필요한 데이터를 얻기가 매우 어렵거나 복잡합니다."라고 설명합니다.

POSCO는 매우 정교한 데이터 생태계를 구축함으로써 데이터 사일로화의 위험을 대체로 피할 수 있었습니다. 이 교수는 그 해답은 바로 통합에 있다라고 말합니다. 즉 데이터 수집과 관리는 커뮤니케이션, 경고, 감지 기술과 직접적으로 연결되어 있습니다. 무엇보다 중요한 것은 POSCO의 경영진이 통계의 중요성을 알리기 위해 노력했으며 그에 따라 현장 관리자들이 통합된 분석 문화를 수용할 수 있었다는 것입니다. 이 교수는 이러한 정신과 함께 수반되는 디지털 아키텍처로 프로젝트를 쉽게 수행할 수 있었다고 말합니다.

물론 JMP도 많은 도움을 주었습니다. "JMP는 작업 시간을 극적으로 줄여주었습니다. R을 사용했다면 작업을 마치는 데 1개월이 걸렸을 것입니다. 그러나 JMP를 사용하면서 일주일 내에 작업을 마칠 수 있었습니다."

이 교수는 또한 JMP 스크립트 언어(JSL)를 사용하여 분석 시간을 단축시켰습니다. 그는 자동차 부품 수리 데이터를 분석하는 프로젝트를 인용하여 “JSL은 당시 표준 JMP UI에서 제공되지 않던 사용자 함수를 활용할 수 있었다는 점에서 유용했습니다. 또한 맵 함수로 한국 지도와 세계 지도 위에 수리 데이터를 시각화함으로써 환경에 따라 추세를 쉽게 파악할 수 있었습니다.”라고 덧붙여 말했습니다.

성균관대학교는 산학 협력으로 AI 문제를 해결할 수 있는 유능한 인재를 배출하고 있습니다.

세계화는 새로운 과제를 제시하고 있습니다. 제조업체가 고객 공장에 보다 가까운 곳으로 해외 공장을 확장함에 따라 분석 통합의 필요성은 빠르게 증가하고 있습니다. 이 교수는 “오늘날 우리가 직면한 중요한 과제 중 하나가 '작업자들의 통계 전문성 격차'를 극복하는 방법입니다.”라고 말합니다.

성균관대학교는 이론을 넘어 산업 분야에서의 응용 가능성에 초점을 맞추면서 당면한 스마트 제조 과제를 해결할 수 있는 새로운 인재를 양성하고 있습니다. 이들은 AI 시스템을 실행하는 통계 모형에 대한 전문성을 바탕으로 어떤 산업에서나 환영받는 인재가 될 것입니다. 이 교수는 또한 이들 새로운 인재들이 AI의 가능성을 현실화하는 데 기여할 것이라고 말합니다.

본 문서에 나와 있는 결과는 여기서 설명하는 특정 상황, 비즈니스 모델, 데이터 입력 및 컴퓨팅 환경에 국한된 것입니다. SAS 고객마다 경험이 다르고 나름의 비즈니스 및 기술 변수를 기초로 하므로, 모든 언급은 전형적이지 않은 것으로 간주해야 합니다. 실제 비용/시간 절약 효과, 결과 및 성능 특성은 개별 고객의 구성과 조건에 따라 달라집니다. SAS는 모든 고객이 유사한 결과를 실현할 것임을 보장하거나 표명하지 않습니다. SAS 제품 및 서비스에 대한 유일한 보증은 해당 제품 및 서비스의 서면 계약서에 명시된 보증 문구에서 설명하는 내용에 한합니다. 본 문서의 어떠한 내용도 추가 보증을 의미하는 것으로 해석해서는 안 됩니다. 고객 성공 사례는 합의된 계약 조건의 일환으로 또는 SAS 소프트웨어의 성공적인 구현 후 프로젝트 성과 요약의 일부로서 SAS와 공유되었습니다.