"못 쓰고 있던 비싼 서버, 딥가젯으로 해결했죠" | 이화여대 Medical AI & Computer Vision Lab 인터뷰 (매니코어소프트 냉각 이식)

MANYCORESOFT's avatar
Jun 03, 2024
"못 쓰고 있던 비싼 서버, 딥가젯으로 해결했죠" | 이화여대 Medical AI & Computer Vision Lab 인터뷰 (매니코어소프트 냉각 이식)

  • Interview date: 2024.05.31

  • Interviewee: 이화여자대학교 인공지능대학 Medical AI & Computer Vision Lab 연구원 ‘J’님 (Researcher. ‘J’, Medical AI & CV Lab@ Department of Artificial Intelligence, Ewha Womans Universtiy)

  • Service: dg- Transplant

Q01. 연구실 소개를 간단히 해주신다면?

이화여대 인공지능대학 내 메디컬AI & Computer Vision 랩은 CT, X-ray 이미지부터 바이러스, 단백질 서열, 혈액 검사 데이터 등 다양한 데이터를 다루고 있습니다. Sequential, table 데이터부터 이미지, 비디오까지 다루는 데이터의 범위가 넓다는 게 특징이라고 할 수 있습니다.

이곳에서는 딥러닝 네트워크 개발, 화질 평가 및 개선, 질병 예측 등의 연구가 활발히 이루어지고 있습니다.

ewha_university_deepgadget_manycoresoft

Q02. 서버실 및 연구 환경은 어떤가요?

이화여대 공과대학에는 두 종류의 서버실이 있습니다. 하나는 대규모 랙을 갖춘 공과대학 서버실로, 항온항습 시설이 완비되어 있으며 소음 걱정이 없는 공간입니다. 다른 하나는 연구협력관 서버실로, 랙 4개 규모의 작은 공간에 위치해 있으며 연구실과 인접해 있어 소음에 민감합니다.

이러한 이유로 소음 문제를 고려해 ‘N’ 사의 ‘D’ 수냉식 서버를 선택했었습니다.


다른 연구실에서는 커스텀 수냉을 사용하기도 하지만, 관리자 변경 시 냉각수 증발 및 누수 등 유지 관리가 어렵다는 인식이 있었습니다. 이러한 이유로 도입을 망설이다가 처음으로 구매한 수냉 서버였습니다.

이 서버를 이용해 메디컬 이미지 디노이징 및 이미지와 비디오 중심의 연구를 수행하고 있었습니다.

ewha_deepgadget_tp_serverroom

Q. 만약 액체냉각 서버가 완전 밀폐돼 있어 냉각수가 반영구적 보존된다면 어떠실 것 같나요?

솔직히 경험해보기 전까지는 믿기 어려울 것 같습니다. 하지만 정말 그런 서버가 있다면, 조용하고 냉각 효율이 높은 액체냉각 서버를 사용하지 않을 이유가 없을 것입니다.

매니코어소프트의 액체냉각 시스템을 한 달째 이용 중인데, 지켜본 후 만족스럽다면 더 적극적으로 이용하고 싶습니다.

Q03. 타사 수냉 서버 사용 중 어떤 문제점이 있었나요?

2021년부터 약 2-3년 동안 사용하던 서버가 갑자기 전원이 켜지자마자 꺼지는 문제가 발생했습니다. 당시 V100 GPU는 성능이 우수해 비디오 연구에 사용 중이었으며, 이로 인해 5명 정도의 연구원이 연구에 차질을 빚게 되었습니다. 기존에 구매했던 업체에 연락했지만, 보증기간이 3년인 점과 업체의 부재로 인해 수리가 어려운 상황이었습니다.


Q04. dg-TP 서비스(매니코어소프트 액체냉각)를 선택하신 이유?

연구 공백을 해소하기 위해 서버 수리를 시도했지만 실패했습니다. 그때 TP 서비스가 있다는 소식을 듣고, 사용하지 못하고 있는 서버를 맡기게 되었습니다.

dg_tp_before

<deep gadget 수냉 이식 전>

dg_tp_after

<deep gadget 수냉 이식 후>

Q05. dg-TP 서비스 후 서버 동작 만족도

TP 서비스를 통해 사용하지 못했던 서버를 다시 사용할 수 있게 되면서 연구가 재개되었습니다. 다른 부품들은 모두 똑같이 보존되고, 기존 데이터와 설정도 모두 똑같이 유지되는 점이 매우 편리했습니다.

현재까지 서버는 조용하고 안정적으로 동작하고 있으며, 매우 만족하고 있습니다. 워크스테이션 타입이지만 랙 맨 아래에 두고 모니터와 함께 사용하고 있습니다.
 

이 서비스를 한 달 동안 사용해본 결과, 현재까지 만족도가 매우 높아 앞으로 다른 서버들도 이 서비스를 이용하고 싶습니다.

타 수냉 서버에 문제가 생길 때뿐만 아니라, 공랭식 서버의 경우 GPU를 여러 개 장착하면 소
음이 매우 커서 반드시 서버실에 넣어야 하는 불편함이 있습니다.

3년이 지나
보증기간이 끝난 서버들은 수리가 어려운 경우가 많은데, 이런 서버들도 TP 서비스를 통해 해결하고 싶습니다.

함께 보면 좋은 글

GPU 서버 성능 100% 활용하는 방법 (Nvidia V100) - 매니코어소프트 딥가젯 tranplant

© 2024 ManyCoreSoft Co., Ltd.

#deepgadget #dg-transplant #dgtp #liquidcooling

Share article
Subscribe to our newsletter.
RSSPowered by inblog