[카테고리:] Topic

  • LLM 서비스 개발할 때, 간단한 RAG 기술만 알아서는 안 되는 이유 (ft. RAG 파이프라인 최적화)

    LLM 서비스 개발할 때, 간단한 RAG 기술만 알아서는 안 되는 이유 (ft. RAG 파이프라인 최적화)

    LLM 서비스 개발할때, 간단한 RAG 기술만 알아서는 안되는 이유 (ft. RAG 파이프라인 최적화)

    #AI

    #RAG

    #LLM

    #RAG 파이프라인

    생성 AI 가장 큰 난제  할루시네이션!  여러분도 LLM 서비스를 개발하면서 이런 할루시네이션으로 인해 원하는 답변이 생성되지 않았던 적이 있으신가요? 이를 해결하기 위해 등장한 것이 바로 RAG(검색 증강 생성) 기술입니다. 하지만  LLM 서비스 개발할때,  RAG를 활용해도 문제가 생기는 경우가 있는데요! 그것은 바로  LLM 서비스에 기본적인 RAG만 사용했기 때문입니다. 

     

    고성능 RAG엔 어떤 것이 있는지, 또 어떻게 구현할 수 있는지, 그리고 RAG 파이프라인의 성능 개선법까지  낱낱이 알려드리겠습니다.

    우선 먼저  LLM 서비스 개발할때,  고성능 RAG를 왜 사용해야하는지부터 자세히 설명드리겠습니다. 

     

    1.고성능 RAG를 사용하지 않을때 어떤 문제점이 발생할까요?

     

    고성능 RAG를 사용하지 않고,  LLM 서비스에 기본적인 RAG (Naive RAG)를 사용했을때 아래와 같은 문제가 생길 수 있습니다.

    ① 정확성 부족: 기본적인 RAG 기술만으로는 원하는 정확도를 달성하기 어려울 수 있습니다. 

    ② 응답 일관성 문제: 고성능 RAG는 더 나은 응답 일관성을 제공하지만, 기본 RAG는 응답이 불규칙하거나 예측 불가능할 수 있습니다.

    ③ 효율성 저하: 고성능 RAG는 더 효율적이고 빠르게 작업을 처리할 수 있지만, 기본 RAG는 처리 속도가 느려질 수 있습니다.

    ④ 복잡한 문제 해결 어려움: 고성능 RAG는 복잡한 문제나 고급 시나리오를 더 잘 처리할 수 있지만, 기본 RAG는 이러한 문제를 해결하는 데 한계가 있을 수 있습니다.

    ⑤ 사용자 만족도 저하: 응답의 정확성과 일관성이 부족하면 사용자 경험이 떨어져 만족도가 낮아질 수 있습니다.

    하지만 LLM 서비스 개발에 고성능 RAG를 사용하면 이러한 문제를 최소화하고 더 나은 RAG를 만들 수 있습니다. 

     

    2. 고성능 RAG란 무엇일까요?

    RAG 도메인의 최근 발전과 함께 고급 RAG(Advanced RAG)는 기본 RAG(Naive RAG) 패러다임의 한계를 해결하기 위해 향상된 기능을 갖춰 진화한 것입니다.  RAG에는 세 가지의 대표 패러다임이 있으며 이로부터 수백가지의 테크닉들이 생겨나고 있습니다. 

     

    1) 대표적인 RAG 패러다임 3가지

    Naive RAG : 전통적인 검색 및 생성 방식을 취하는 가장 간단한 RAG 연구의 초기 방법론입니다.
    낮은 검색 정확도, 응답 생성의 낮은 품질, 증강 과정의 어려움과 같은 단점이 있습니다.

     

    ② Advanced RAG : 기본 RAG의 단점을 보완하기 위해 고안된 방법론으로, 크게 검색 전 절차(Pre-Retrieval Process), 검색 후 절차(Post-Retrieval Process), RAG 파이프라인 최적화(RAG Pipeline Optimization)의 3단계로 나누어볼 수 있으며 현업에서  LLM 서비스개발하며, RAG를 구축할 때 필수적으로 알아야 할 개념입니다. 

     

     

     

    ③ Modular RAG : 현존하는 RAG 테크닉 중 최고 효율을 발휘하는 RAG입니다. 성능을 향상시키기 위해 유사성 식별을 위한 전용 검색 구성 요소와 같은 새로운 기능을 통합하고 목표에 따른 미세 조정을 통해 리트리버를 최적화했습니다. 특히 모든 시스템 구성 요소에서 직렬 정보 처리와 원활한 엔드투엔드를 촉진하기에,  LLM 서비스 개발할때 모듈식 RAG 전략의 채택이 증가하고 있습니다.

     

    이러한 대표 패러다임을 넘어 최근에 수많은 RAG 테크닉들도 생겨나고 있는데,  어떤 것들이 주목받고 있을까요? 

     

    2) 2024년 학계에서 화제가 된 RAG 테크닉 6가지

    2024년 최신 논문에서 다루는 RAG 기술까지 조합까지 한다면 더욱  LLM 서비스에 고성능 RAG를 구축할 수 있습니다.

     

    ① SELF-RAG

    “반영 토큰”이라는 특별한 토큰을 사용하여 자신이 생성한 텍스트의 질을 평가하는 프레임워크입니다.

     

    ② Corrective RAG

     

    Robustness of Generation을 향상하기 위해 관련성이 없는 문서를 관련성이 있게 바꿔주는 프레임워크입니다.

     

    ③ T-RAG

     

    컨텍스트 검색을 위해 벡터 데이터베이스에 추가로 엔티티 트리(entities tree)를 포함하는 프레임워크입니다.

     

    ④ Multi-Hop RAG

     

    인풋 쿼리와 관련된 컨텍스트를 찾기 위해 여러 검색 단계(Multi-Hop)를 거치는 프레임워크입니다.

     

    ⑤ RAPTOR-RAG

     

    텍스트 청크를 클러스터링하고 요약하여 계층적 트리 구조를 형성함으로써 상향식으로 접근하는 프레임워크입니다.

     

    ⑥ Adaptive RAG 

     

    입력하는 질문의 복잡성을 기반으로 RAG에 가장 적합한 전략을 동적으로 선택하는 프레임워크입니다.

     

    3.  높은 성능의 RAG 파이프라인을 구성하기 위한 성능 평가와 단계별 최적화

    RAG테크닉을 넘어 RAG 파이프라인까지 최적화한다면 더 좋겠죠? RAG 파이프라인을 최적화하기 위해서는, RAG 파이프라인의 각 단계에서 어떠한 모듈이 성능 저하를 일으키는지 성능 평가를 통해 파악하고 이에 걸맞는 최적화 전략을 수립하여야 합니다.  어떤 방식들이 있을까요?

    ① 텍스트 청킹

    Fixed size Chunking, Content Aware Chunking 등 다양한 텍스트 청킹 전략이 있습니다. 다루는 데이터 타입에 따라 사용할 전략이 달라집니다. 

    ② Search Space 최적화

    문서를 Chunk 단위로 Represent하기 위해, 청킹된 데이터를 계층별로 저장하고 데이터 포인트를 설정합니다.

    ③  데이터 포인트 설정

    태그 설정, Document Transformation,Summarization을 통해 데이터 포인트를 설정하여 Retrieval하는 과정에서 정보를 누락하거나 무관한 청크를 검색하는 일을 줄입니다. 이로 인해 RAG 파이프라인 성능을 개선할 수 있습니다. 

    ④ 인텐트 분석

    LLM과 Pydantic을 활용하여 사전에 몇 가지 프롬프트를 정의하면 의도에 대한 답변을 내놓는데, 결과값이 정형화되어야 이를 활용할 수 있습니다. 이를 통해 에이전트의 행동 방식을 정의합니다.

    ⑤ Reranking

    Domain-Specific한 영역에서는 데이터 포인트 설정을 잘 해도 검색 성능이 떨어질 수 있는데, 이 때 현재 쿼리랑 유사한 청크만 다시 선별하여 마지막 10%~20%의 RAG 파이프라인 성능을 올려줍니다.

    ⑥ 답변 생성

    생성기를 사용하고 이를 튜닝하여  LLM 서비스가 정확도와 관련이 높은 답변을 생성하도록 합니다. 이 과정까지 하면 높은 성능의 RAG 파이프라인을 구성할 수 있습니다.

    이렇게 할루시네이션 없는 LLM 서비스 개발할때,  정확한 RAG를 만들기 위한 테크닉과 RAG 파이프라인 성능 개선 방법을 알아보았는데요!  앞선 모든 것들을 한 번에 배울 수 있는 강의가 있습니다! 

    [고성능 RAG를 위한 66가지 최신 RAG 테크닉 (ft. Advanced RAG, Modular RAG)]

    강의 바로 보러가기

    이 강의는  4가지 프로젝트로 직접 RAG를 만들어보며 실무까지 도입할 수 있게 도와드려요. 금융권, S사, MS에 종사하고 계시는 강사님이  RAG 파이프라인 성능 개선도 알려주시니 안 배워볼 수 없겠죠? 어려운 RAG, 66개 RAG 개념부터 탄탄하게 알려드리니, 꿈만 꿨던 고성능 RAG 만들 기회 놓치지 마세요!

     

    *원문 출처 :  Advanced Retrieval-Augmented Generation: From Theory to LlamaIndex                  Implementation

     

                                   10 Ways to Improve the Performance of Retrieval Augmented Generation Systems

     

     

  • 2024년을 강타할 AI 동영상 생성 프로그램 BEST 4

    2024년을 강타할 AI 동영상 생성 프로그램 BEST 4

    2024년을 강타할 AI 동영상 생성 프로그램 BEST 4

    #AI 고객센터

    #AICC

    #LLM

    | 🎬 텍스트로 영상 만들기가 가능한 시대가 도래하다 : Text to video

    📢 Q. 요즘 이미지는 다 생성 AI가 만든다던데, 그럼 영상은 누가 만드나요?
    A. 영상도 ‘AI’가 만듭니다!


    런웨이, 텍스트 프롬프트를 이용해 영상 생성-편집 가능
    전문 매체 “꽤 인상적”…수년 내 빠른 발전 이룰 것

    캐릭터 디자인에 음성까지… ‘생성AI’ 적용한 게임 눈 앞

    AI 활용해 만든 광고 확산… “제작 기간 3분의 1로 줄어”

    생성 AI가 바꿀 2024년 트렌드

    런웨이, 동영상 생성 AI 업데이트로 인기… “생성AI의 게임 체인저”

    텍스트를 이미지로 구현해주는 ‘달리’나 ‘미드저니’, ‘스테이블디퓨전’ 등 AI 이미지 생성 기술에 이어 이번에는 ‘AI 동영상’을 만들어주는 생성 AI 기술이 눈길을 모으고 있습니다. 생성형 AI에 대한 관심도가 높아지고, 그 기술의 효율이 입증되면서 현재는 정말 다양한 직군에서 해당 툴을 사용하고 있는데요. 브랜드 런칭 이미지, 패션 모델 이미지, 게임, 3D 맵핑, 광고 등… 사용하지 않는 분야를 찾기 어려울 정도로 빠른 속도로 활용도가 급증하는 모습을 확인할 수 있습니다.
    특히, 디즈니와 마블 스튜디오, 제일기획, ANIDAR 등 내로라하는 국내외 대형 기업들도 AI로 영상 및 마케팅 홍보 이미지를 제작하기도 한다고 해요. 마블의 최신 드라마인, ‘시크릿 인베이젼’의 경우 AI로 오프닝 영상을 제작했다는 점에서 또 한 번 화제가 되었습니다.

    촬영과 편집을 기반으로 제작되던 영상이 이제는 텍스트에서 이미지, 이미지에서 영상 생성이 되기까지!
    영상 시장의 판도를 바꿔가고 있는 AI 동영상 제작 툴, 이제는 이미지를 넘어 영상의 시대가 옵니다.

    지금부터 2024년을 강타할 AI 동영상 제작 프로그램 BEST 4와 함께 여러분이 궁금해하셨던, 동영상 만들어주는 AI 기술의 모든 것, 킵콴 강사님의 QnA를 바로 확인해봅시다.

    | 2024년을 강타할 AI 동영상 제작 생성 프로그램 BEST 4 : Runway, Pika Labs, Kaiber, LeiaPix까지

    1. Runway

    – 시네마틱 영상을 제작하는데 해외에서 가장 많이 활용되는 툴
    – 영상 제작 뿐만 아니라, 런웨이 자체 웹과 앱서비스를 통해 제공하는 툴이 다양함.
    – 카메라 모션, 속도, 방향 등 다양한 부분을 직접 지정할 수 있음.
    – text to video 뿐만 아니라, img to video, video to video 도 가능함.

    그러나, 크레딧을 소모하는 유료 서비스로, 소모량이 높아 비용이 다소 발생하고 인물이나 배경, 오브젝트 등의 뭉개짐, 빛이 점점 강해지는 현상 등이 자주 있어 프롬프트로 조정하거나 몇번의 생성 시도가 필요하다는 점도 알아두시면 좋을 것 같습니다.

    2. Pika Labs

    – 자연스러운 영상을 잘 만들 수 있음.
    – img to video 기능이 탁월하여, 원본 소스를 많이 훼손하지 않고 영상으로 변환할 수 있음.
    – 영상제작을 돕는 프롬프트 명령어가 있어 손쉽게 조정 가능함.
    – fps – 초당 프레임도 직접 조절이 가능함. 현재 무료로 사용 가능함.
    – 모바일 디스코드 앱으로 편리하게 작업 가능함.

    그러나, 별도의 웹 서비스가 아닌 디스코드를 통해서 작업해야한다는 폐쇄성으로 양날의 검이라는 의견이 오가기도 하며, 워터마크 표식이 항상 붙는다는 점, 생성되는 영상 해상도 저하 등의 아쉬운 점이 있다고 해요.

    3. Kaiber

    – 프레임에 따라 변화하는 Flipbook과 물 흐르듯 애니메이션을 생성할 수 있는 motion을 제작할 수 있음.
    – prompt to video, img to video, sound to video 등 다양한 생성 서비스를 제공함.
    – 자체 개발한 앱과 웹서비스로 영상을 제작할 수 있음. 영상과 영상 간을 이어주는 이펙트 씬을 제작하는데 좋은 툴임.
    – 애니메이션 작화에 강한 편

    그러나, 크레딧을 소모하는 유료 서비스이고, 프롬프트를 입력해서 영상을 제작하는데 뛰어난 퀄리티나, 원하는 방식의 모션, 그래픽을 표현하기 위해서는 상당한 시도가 필요하다는 점도 유념해주세요!

    4. LeiaPix

    – 2D 이미지를 3D 영상처럼 만드는 생동감 있는
이미지 컷 제작 가능함.
    – 최근 표준 이미지를 깊이 있는 애니메이션으로 변환하는 기능 도입함.
    – 사용자가 선택한 이미지를 깊이 인식이 향상된 애니메이션으로 변환 가능함.
    – 특히 심도 애니메이션 기술은 이미지 품질을 일관되게 유지하여 비주얼 아티스트와 일반 사용자 모두에게 디지털 이미지를 향상시키는 도구를 제공함.
    – 손쉽게 평면 이미지를 움직이는 이미지로 만들어 제안서, 카드뉴스, 영상 프레임 일부에 특별한 포인트를 줄 수 있음.

    그러나, 다양한 방향으로 움직임을 줄 수 있지만 아직은 단조로운 모션만 가능하고, 단독으로 사용하여 영상 콘텐츠 내에서 반복적인 모션을 지속적으로 사용한다면 콘텐츠를 소비하는 사람들은 영상을 보며 어지러움을 유발할 수 있습니다.


    💡이러한 4가지 툴은 각각 장단점이 명확하기 때문에 장르별 영상 즉, 광고/애니메이션/시네마틱 등 영상 종류에 따라, 본인이 구현해내고 싶은 영상의 효과와 분위기에 따라 취사선택하여 각 툴을 사용하면 된답니다.

    | 🌐 Keepkwan Insight : 영상 생성 AI 툴 궁금증 QnA

    AI 영상 툴을 살펴보신 여러분! 점차 AI 영상 툴의 매력에 빠져들고 계시진 않나요?
    그런데 “영상 만들어주는 AI가 2024 생성 AI 트렌드이고, 본인이 표현하고픈 영상 분위기와 효과에 따라 적절히 활용할 수 있다는 건 알겠는데, 진짜 얼마나 영향력이 있을지 궁금해요! 지금 꼭 배워두는 게 좋을까요?” 라고 고민하시는 분들을 위해 준비했습니다.

    [AI 영상 툴을 활용한 광고/애니메이션/시네마틱 영상 제작] 강의를 리딩하고 계신 킵콴님께 ‘직접’ 여쭤봤습니다.
    가장 대표적인 질문부터 함께 알아봅시다.


    Q1. 생성 AI 영상 제작 툴의 전망 및 활용 범위는 어디까지 발전했다고 보시나요?
    현재 툴에 대한 인지도는 어느정도 일까요?

    A. 이미지 생성 AI의 발전 속도는 정말 빠르게 발전했습니다.
    미드저니를 예로 들어보면 2022년 7월 오픈베타 출시했을 때 생성했던 이미지와 현재 2023년 11월 기준으로 버전 5.2로 생성한 이미지와 비교한다면 놀라운 차이를 볼 수 있습니다. 영상 생성 AI는 2023년부터 이미지와 함께 빠르게 발전해오고 있고 Text-to-Movie, Image-to-Movie, Movie-to-Movie 다양한 변환/생성 기술을 통해 영상 생성의 디테일은 놀라움을 안겨주고 있는데요.

    이러한 영상 생성 AI를 통해 예전에는 AI가 만드는 영상이라는 신기함으로, 일종의 ‘밈(meme)’으로 시작했던 것이 현재는 광고, 영화, NFT(크립토아트), 그리고 숏폼을 중심으로한 다양한 AI영상콘텐츠로 확장되고 있습니다.

    저 역시 실제로 기업들과 콜라보를 통해 광고를 제작하고 있고, 1인으로 영화를 제작하고 있으며, 국내외에서 AI 영상을 통한 작품을 제작하여 전시를 진행 중에 있습니다. 따라서 영상 생성 AI를 주로 사용하는 산업군은 저와 같은 1인 콘텐츠 창작자를 제외하고, 광고, 영화, 그리고 게임업계에서 활용하고 있습니다.

    Q2. 그렇다면 많은 사람들이 AI 영상 제작 툴에 반응하고, 관심을 가지는 이유는 무엇일까요?
    앞으로 얼마나 더 발전할지 궁금합니다.

    A. AI를 영상 제작에 활용하는 가장 큰 이유는 ‘비용 절감’과 ‘시간 절약’이 아닐까 싶습니다.
    그동안 하나의 영상 제작에 큰 비용과 시간을 투자하였다면, ‘시간을 생성하는 AI’ 덕분에 같은 시간으로 다양한 영상을 제작하고 더 저렴한 비용을 투자할 수 있게 되었습니다. 그렇기에 앞으로는 더 많은 산업군에서 관심을 갖고 영상 제작에 AI를 활용하는 사례가 더욱 많아질 것 같은데요.
    그리고 무엇보다도 저처럼 1인 크리에이터가 충분히 영상콘텐츠를 제작하며 새로운 산업을 만들어갈 수 있는 시대이기 때문에 AI를 활용하는 스펙트럼이 훨씬 넓어지게 될 것이라 생각합니다. 영상 생성AI 기술은 아직 초반임에 불구하고 하루가 다르게 새로운 툴이 출시되고, 이전에 출시된 것들도 빠르게 보완 업데이트가 이루어져 더욱 디테일한 영상을 제작할 수 있게 되었습니다.

    현재 어디까지 도달했는지 파악하기도 전에 발전하고 있기 때문에, 가장 중요한 것은 AI를 활용해서 어떤 이야기를 만들 수 있을지 자신의 이야기에 좀 더 집중하며 그 이야기들을 수집하며 빠른 속도로 발전하는 AI를 적극적으로 수용하며, 협업하면서, 즐기는 마음으로 매일 함께하면 좋을 것 같습니다.

    Q3. [AI 영상 툴을 활용한 광고/애니메이션/시네마틱 영상 제작] 강의에서 강사님이 가장 강조하고 싶으신 Key Point가 있을까요?

    A. 이번 강의에서 가장 강조하고 싶은 포인트는 누구나 쉽게, 누구나 제작할 수 있는 애니메이션, 영화, 광고 실습파트입니다.
    자신이 표현할 이야기가 있다면 누구든지 AI와 함께 애니메이션을 만들 수 있고, 짧은 영화한편을 만들 수 있으며, 광고를 제작해볼 수 있습니다. 만약 해당 직군에 있는 분들이라면 어쩌면 더 멋진 작품을 만들 수 있을 것이라 생각됩니다.

    특히, 초심자들도 쉽게 다룰 수 있는 다양한 AI 툴과 실습자료를 준비했기 때문에, 천천히 차근차근 실습을 진행하면서 영상을 완성시켜 보세요. 나만의 작품을, 광고를, 애니메이션을 완성했다는 희열을 꼭 느껴보셨으면 합니다!

    Q4. 영상 생성 AI 툴이 지금은 초기이다 보니, 장점도 많지만 그만큼 개선되어야 할 점도 보이는데요!
    AI 영상 제작 툴 별로 단점을 보완하기 위해서 어떤 방향으로 개선되었으면 하는지, 그리고 반대로 기대되는 점도 궁금합니다.

    A. 저 역시도 모든 툴이 아직 ‘갓 태어난 아기’라고 생각됩니다.
    지금은 ‘AI가 이렇게까지 만들 수 있네?’ 라며 신기해 하지만 영상의 디테일, 화질, 모션 등 개선해야할 부분들을 너무나 많습니다.

    Runway는 최근 업데이트로 많이 개선되었지만 그래도 일부 작화에 대한 인식 및 화질개선과 카메라 모션에 대한 불안정도 개선이 필요합니다.
    Pika Labs는 디스코드 기반으로 이루어지는데 전반적인 4k 이상의 화질로는 구현이 아직 어렵습니다. 그리고 영상을 제어할 수 있는 더 다양한 파라미터가 있었으면 하는 바람이고요.
    Kaiber는 Runway와 더불어 적극적으로 업데이트를 하고 있는 툴입니다. 최근 모바일 앱도 출시되었는데, 이제는 이제는 영상 디테일 부분이 좀 더 개선되었으면 합니다.
    마지막으로 LeiaPix는 2D이미지를 입체적으로 표현해주는 기능이외에 영상이나 3D툴에 직접적으로 사용할 수 있는 기능이 추가된다면 더욱 강력한 툴이 될 것이라고 생각해요.

    이렇게 모든 툴들이 계속해서 업데이트 되고 있지만, 가장 기대되는 것은 실제 상업 영화로도 활용할 수 있을 정도로 깨끗한 화질과 부드러운 움직임, 더 다양한 카메라 모션 등이 업데이트 될 것을 기대하고 있습니다. 현재는 위의 부족한 부분들에 대해서 복수의 서비스와 툴들을 적절히 혼합하고 보완하여 영상으로 제작하고 있어요.

    Q5. 이 강의를 들은 이후 Next step은 어떻게 될까요?
    개인이 어떻게, 어떤 방식으로 활용할 수 있을지가 궁금합니다.

    A. 본 강의는 AI와 친해져서 영상을 제작할 수 있는 방법에 대해 나누고 있습니다.
    강의를 모두 수강하신 이후에는 개인이나 현업에서 활용하실 분들은 ‘자신만의 이야기를 가공하는 것’과 ‘이야기를 영상으로 어떻게 표현할 지’에 대해 끊임없이 연습이 필요할 것 같습니다.

    ❗ Tips 나만의 이야기를 가공하고, 영상으로 표현하는 6가지 연습

    – 나의 이야기를 직접 글로 표현할 것, AI에게 전달할 묘사하는 힘을 키우는 것이 중요합니다.
    – 영상의 재료가 되는 미드저니와 같은 생성AI 이미지 툴을 많이 다루고 익숙해지는 것이 필요합니다.
    – 다양한 영상 생성AI툴의 각 장단점을 비교하고, 서로 Mix하여 더 나은 영상을 만드는 연습이 필요합니다.
    – 그리고 만들어진 영상들을 적극적으로 주변에게 보여주고, 피드백을 얻고, 발전시키는 것이 중요합니다.
    – 이런 과정으로 익숙해진다면 활용할 방향성을 찾는 것은 각자 다 다를 것이라 생각됩니다. 유튜브 콘텐츠로 활용될 수 있을 것이고, 실제 광고를 제작하기 전 스토리보드나 레퍼런스 영상으로 활용할 수 있을 것이고, 직접 영화감독도 될 수 있을 것입니다.
    – 그러기 때문에 가장 처음에 언급한 내가 무슨 이야기를 표현할 것인지, AI와 함께 내가 만들고 싶은 이야기를 정하는 것이 가장 중요하다고 생각합니다.

    🙋🏻‍♂️ 더불어 말씀드리고 싶은 점이 있는데요, 저의 Next step은 1인 영화감독입니다.
    AI와 함께 상업영화를 제작하여 작은 영화관이나 좋은 기회가 된다면 상업영화관 중 1관이라도 직접 상영하는 것이 목표입니다. 그렇기 때문에 현재 1시간 이상 분량의 영화를 AI툴을 활용하여 제작 중에 있어요. (웃음)

    Q6. AI 영상 생성 툴을 잘 활용하려면 관련 전공을 하거나 지식이 있으면 더 쉽게 배울 수 있을까요?
    저는 관련 전공도 아니고, 지식이 부족한데요..!

    A. 저는 영상관련 전공자도 아니고 더욱이 AI기술에 관한 업력이 있는 것도 아닙니다.
    오로지 AI기술에 관심을 갖고, 나만의 이야기와 상상을 갖고 있는 평범한 사람입니다. 만약 영화 촬영에 대한 지식을 갖고 있다면 자신의 경험과 지식을 기반으로 좋은 작품을 AI와 함께 만들 수 있을 것입니다.
    그렇지만 관련 지식이 없어도 AI 기술과 자신의 이야기를 Mix하여 훌륭한 콘텐츠를 제작할 수 있습니다. 걱정하지 마세요!

    Q7. 그렇다면 결국 이 AI 영상 제작 툴을 사용할 때 가장 유념해야 할 점이 있다면 무엇일까요?

    A. ‘AI가 만들었다는 신기함에 도취되지 않는 것’이 중요한 것 같습니다.
    가장 중요한 것은 영상에 무엇을 담을 것인지에 대한 인간이 이야기 창작, 상상이 가장 중요합니다. 인간이 가장 먼저라는 것을 항상 생각하며 생성 AI와는 ‘협업’ 하여 이야기를 영상화하면 좋을 것 같습니다.
    도취되어 작업하다보면 어떤 분은 ‘AI가 일자리를 모두 빼앗겠구나’라는 자괴감에, 어떤 분은 앞으로 더 다양한 배움에 대한 목마름이 사라질 수도 있습니다. 그렇게되면 기술 앞에서 우리가 멈추게 될 수 밖에 없습니다.

    따라서 툴 사용법에 대한 유념보다는 ‘마인드셋’, 즉 우리 인간이 갖고 있는 창작의 힘에 대한 믿음이 가장 중요한 것 같습니다.

    Q8. 강의 수강생들에게 강사님이 전하고 싶은 말씀이 있으시다면, 자유롭게 부탁드립니다!

    A. 본 강의의 궁극적인 목적은 영상으로 만들 이야기가 있다면 누구나 쉽게 AI와 협업하고, 누구나 할 수 있는 AI영상 제작을 나누는 것입니다.

    “여러분과 저의 머리 속에는 알게 모르게 자신만의 세계가 존재합니다. 그것이 이미지일 수도 있고, 텍스트 일 수도 있고, 흐리지만 어떤 영상일 수도 있습니다. 이젠 그것을 머리 속에만 담아두지 말고, 현실로 쉽게 불러올 수 있는 창이 열렸습니다. 여러분의 살아 움직이는 이야기를 앞으로 펼쳐질 인간과 AI, AI와 인간의 세상 속에 마음껏 펼쳤으면 좋겠습니다.”

    글쓴이 소개

  • 1주 1장애 성장통을 이겨낸, 데이원컴퍼니 CTO가 말해주는 장애 대응이란?

    1주 1장애 성장통을 이겨낸, 데이원컴퍼니 CTO가 말해주는 장애 대응이란?

    1주 1장애 성장통을 이겨낸,
    데이원컴퍼니 CTO가 말해주는 장애 대응이란?

    #장애대응

    #장애대응매뉴얼

    #장애대응프로세스

    1.장애 대응 뭣이 그렇게 중헌디? 

    개발자들은 듣기만 해도 ptsd 오고 스트레스 받는 장애 상황!

    고객의 신뢰성과 만족도에 직접적으로 영향을 미치는 장애, 장애 상황을 빠르게 파악하고 대응하는 것이 정말 정말 정말 중요해요.

    하지만, ‘장애는 겪어봐야 안다’는 말이 있듯, 겪기 전까지는 정보도 장애 대응 프로세스도 알기 어려운 슬픈 현실이죠. 대기업들의 장애 대응 프로세스나 문화에 대한 기술 블로그는 쉽게 찾을 수 있어도 스타트업부터 성장해 온 회사의 생생한 장애 상황과 장애 대응 매뉴얼에 대한 이야기는 보지 못하셨을 텐데요!

    그렇게 중요하다고 하는데, 정작 정보 얻기는 어려운 장애 대응! 그래서 야심 차게 준비해 봤어요.

     

    2.끊임없는 성장 속에서 피할 수 없었던 장애 상황! 데이원 컴퍼니 CTO는 어떻게?

     

    “4년간 회원 수 4배 상승, 전 년 대비 온라인 매출 약 3배 증가의 성장통을 겪어오신 
    데이원 컴퍼니의 CTO님께서 말씀해주시는 장애 대응이란”

     

    | CTO님 간단히 소개 부탁드립니다.
    안녕하세요! 저는 데이원 컴퍼니의 CTO를 맡고 있는 심승건이라고 합니다.  패스트 캠퍼스 개발팀장에서 시작해 CTO가 된지는 약 1년 정도가 됐습니다. 

     

    | 정말 많은 장애 상황을 겪어보셨을 텐데, 정말 아찔했던 경험?
    저도 신입이나 주니어 연차에는 심장이 빨리 뛰거나 엄청 당황했었죠. 지금은 문제 해결에 초점을 맞춰서 오히려 더 침착하게 대응하고 있어요. 이 직업을 가진 이상 장애 상황은 피해 갈 수 없고, 문제 해결보다 감정을 해결하는 게 우선이 되면 안된다는 생각을 항상 가지고 있습니다.

    그래서 아찔했던 경험보다 큰 규모의 장애 상황을 말해보자면, 현재 회사가 4개의 CIC 구조로 하나의 데이터베이스를 사용하고 있습니다. 상세페이지 하나만 오류가 나거나 했으면 그래도 괜찮았을 텐데, 데이터베이스 오류라 전체 CIC 페이지에 영향을 미쳤던 적이 있어요. 

    MySQL에서 PK 프라이머리키가 설정이 안되면 오류가 나는 버그가 있어서, 데이터베이스를 내렸다가 올렸었습니다. 이 과정에서 모든 인스턴스를 주입해서 해결해야 했기 때문에 번거로움을 겪었었죠. 전사적으로 영향을 미치는 장애 상황이기 때문에 상당히 큰 규모의 장애 상황이었습니다.

     

    |  회사가 성장하면서 장애 대응에 있어서 달라진 점은?

    오히려 과거 장애 대응은 훨씬 간편하고 쉬웠죠. 서버들이 하나의 인스턴스에 존재하던 상황이라 터미널에서 몇 번만 작업하면 장애가 해결되는 손 쉽게 해결할 수 있는 상황이었습니다. 

    하지만 사용량 증가, 쿠버네티스 도입 등 스케일러블하게 인프라가 구축된 상황이라서 장애 원인 파악과 복구 과정이 복잡해졌다고 할 수 있죠. 고도화된 인프라와 배포 체계를 갖추게 되면서 물론 안정화 측면에서는 향상되었지만 장애 원인을 파악하고 대응하는데 속도가 더 느려진 부분은 있습니다.

     

    |  실무에서 자주 겪는 장애 상황은?

    수요 예측 실패로 인한 장애 상황이 흔하지 않을까 싶어요. 마케팅 이벤트나 갑자기 바이럴 효과 때문에 트래픽이 급증할 때 기존 서버로 감당이 안 될 때가 있죠. 

    저희도 페이지에 들어오면 30원을 지급하는 이벤트를 진행한 적이 있는데 그 때 실시간 검색어, 바이럴 되면서 트래픽이 100배 이상 뛰었던 적이 있어요. 기존에는 서버 두 대로도 충분했는데 그 때는 200대 띄워도 겨우 버틸 정도로 트래픽이 급증했었죠.

     

    |  그렇다면 수요 예측은 어떻게?

    조금 당황스럽게 들리실 수도 있지만 ‘당해보면 알 수 있습니다’. 사실 아무리 예측한다고 해도 변수들이 많기 때문에 예측이 어려운 것도 있죠. 그래서 한 번 당해보고 그 경험을 토대로 변수들을 최대한 줄여가고 있다고 생각해 주시면 될 것 같아요.

    또 다른 방안으로는 STATIC 웹 페이지를 별도로 만들어서 모든 트래픽을 몰아 줄 수는 있죠. 다만, 별도로 페이지를 안 만드는 이유는 고객이 저희 서버에 들어와서 무언가 행동을 하는 게 모두 데이터베이스에 남기 때문에 최대한 저희 페이지로 들어오게끔 하고 있습니다.

    *정적 웹 페이지 (Static Web Page):  웹 서버에 이미 저장된 파일(HTML 파일, 이미지, JavaScript 파일 등)을 클라이언트에게 전송하는 웹 페이지

     

    |  장애 대응에 있어 자주 사용하는 방법&전략은?

    아주 기본적인 방법인 롤백 전략을 많이 쓰는 거 같습니다. 문제가 생기면 바로 롤백하고 있어요. 인프라를 쉽게 배포하고 다시 내릴 수 있기 때문에 자주 활용하고 있죠. 또 스테이징 환경이라고 실 서버와 비슷하게 만들어놓은 환경에서 운영 환경으로 이전하기 전에 검증을 진행하고 있습니다.

     

    |  경험에서 나오는 찐 노하우! 장애 대응에서 가장 중요한 Point는?

    우선 멘탈케어가 중요하다는 말을 하고 싶어요. 처음 장애를 겪으면 누구나 당연히 힘들고 괴로워요. 근데 또 한두 번 겪다 보면 괜찮아져요. 다 사람이 하는 일이니깐, 어차피 엔지니어들은 장애 상황을 피할 수 없기 때문에 두려움을 이겨내는 과정이 중요한 것 같아요.

    그리고 경험이 쌓이면 적절한 타이밍에서의 판단이 중요해지죠. 장애가 발생했을 때 어디서부터 봐야 할 지에 대한 인지가 생기겠죠? 그러면 이제 트래픽 문제인지 코드 문제인지를 파악하고 오래 걸릴 것 같으면 롤백부터 진행할 필요가 있어요. 시간이 소요되면 고통받는 사용자들이 늘어나고 또 회사는 그 시간만큼 돈을 못 버니깐 빠르게 판단하고, 서비스 완전 정상화는 어렵더라도 굴러가게 끔까지는 해야 하는 상황 판단이 굉장히 중요합니다.

     

    |  데이원컴퍼니에서 장애 대응에서의 목표는?

    사실 장애 상황 피해 갈 수는 없거든요. 그래서 장애를 발생시킨 누군가를 탓하는 것보단 문제 해결에 초점을 맞춰서 장애를 해결한 사람이 박수를 받는 문화를 만들고 싶어요. 사람은 누구나 실수를 할 수 있고, 또 일하다보면 생길 수 있는 일이기 때문에 그걸 같이 해결해가려는 문화를 조성하고 있고 또 유지해가려고 합니다.

     

     

     

    3.이런 귀한 인터뷰 아니면 얻기 어려운 장애 대응 매뉴얼&정보!

     

    강의 만들 때 정보 얻기도 강사님 구하기도 정말 어려웠어요, 그래서 장담할 수 있습니다!

    ▶ ONLY 이 강의에서만◀ 어디에서도 볼 수 없었던 장애 대응 프로세스 모든 것을 담았어요.

     

    실제 빈번하게 겪는 8가지 장애 케이스를 100% 실습으로 진행!

    수백가지의 장애 상황을 겪어보신 10년차 강사진과 함께해요.

  • 2024년 LLM기반 AI서비스 개발 고도화의 핵심 : 프롬프트 엔지니어링, RAG, Function Calling

    2024년 LLM기반 AI서비스 개발 고도화의 핵심 : 프롬프트 엔지니어링, RAG, Function Calling

    2024년 LLM기반 AI서비스 개발 고도화의 핵심 : 프롬프트 엔지니어링, RAG, Function Calling

    #LLM

    #프롬프트엔지니어링

    AI 서비스 성능이 향상되면서 챗봇, 지식 관리 시스템, 콘텐츠 생성 등 다양한 LLM을 기반으로 AI서비스가 개발되고 있습니다. 그중에서도 최근에는 많은 기업들이 OpenAI사에서 만든 GPT모델을 이용해 프롬프트 엔지니어링만으로 AI 서비스를 빠르게 만들고 있는데요. 더 자세히 알아보겠습니다.

    1. 프롬프트 엔지니어링이란 무엇일까요?

    프롬프트 엔지니어링이란 더 정확한 출력을 유도하기 위해 입력 쿼리 또는 명령을 정제를 하고, 프롬프트를 반복해 성능을 최적화하는 것입니다. 프롬프트 엔지니어링을 할때 대부분의 노력은 실제로 프롬프트 작성에 있지 않습니다. 오히려 프롬프트 엔지니어링에서 가장 중요한 것은 강력한 평가 체계를 개발하고, 그에 따라 테스트하고 반복하는 것입니다.

    2. 프롬프트 개발 생명주기 : 프롬프트 엔지니어링 고도화 방법

    이러한 프롬프트 엔지니어링 고도화하는 방법을 살펴보기에 앞서 작업을 위한 프롬프트를 개발할 때 사용하는 주요 프로세스를 살펴보겠습니다.

    1단계 :  작업 및 성과 기준 정의: 가장 먼저 클로드가 수행할 특정 작업을 명확하게 정의하기

     

    엔터티 추출, 질문 응답, 텍스트 요약부터 코드 생성이나 창의적 글쓰기와 같이 더 복잡한 작업을 수행할 수 있습니다. 작업을 명확히 정의한 후, 평가 및 최적화 과정을 이끌어 나갈 성과 기준을 수립해야 합니다. 처음부터 명확하고 측정 가능한 성과 기준을 설정해줄 경우, 프로세스 전반에서 정보를 기반으로 결정을 내려 올바른 목표를 위해 최적화 할 수 있습니다. 

     

    2단계 : 테스트 케이스 개발: 다양한 테스트 케이스 만들기
    기준을 수립한 후에는, 응용 프로그램의 의도된 사용 사례를 커버하는 다양한 테스트 케이스 세트를 만들어야합니다. 이때, 일반적인 예제와 엣지 케이스 모두를 포함해 프롬프트가 견고하도록 만드는 것이 핵심입니다. 

     

    3단계 : 초기 프롬프트 설계: 표준 입력 및 출력 정의하기
    작업 정의, 좋은 응답의 특징, 그리고  클로드가 따를 수 있는 표준 입력 및 출력을 예시에 정의합니다.

     

    4단계 : 테스트 케이스에 대한 프롬프트 테스트: 일관된 평가기준으로 테스트 케이스 비교 평가하기
    테스트 케이스를 사용하여 클로드에 초기 프롬프트를 입력하고 예상 출력과 성공 기준을 비교하여 평가합니다. 성능을 평가할 때 가장 중요한 것은 일관된 평가기준을 적용하는 것입니다. 

     

    5단계 : 프롬프트 테스트 케이스 반복 수행 및 클로드 수정하기
    테스트 케이스에서의 성능을 개선하고 성과 기준을 더 잘 충족시키기 위해 4단계의 과정을 반복적으로 수행하고 수정합니다. 이 과정에서 클로드의 행동에 설명, 예시 또는 제약 조건이 추가될 수 있습니다. 하지만 집약적인 입력 세트 추가는 능력 저하로 이어질 수 있으니 주의해야합니다.

     

    6단계 : 프롬프트 출시- 최종 프롬프트를 배치하고 모니터링 하기
    최종 프롬프트를 응용 프로그램에 배치합니다. 초기 테스트 세트에서 예상하지 못한 극단적인 경우가 발생할 수 있기 때문에  모델의 성능을 계속해서 모니터링하고 필요한 경우 추가적인 개선을 준비해야 합니다. 

     

    이 과정을 통해 능력이 뛰어난 모델과 제약없는 프롬프트를 시작할 수 있습니다. 원하는 풀력 품질을 달성했다면 필요에 따라 지연 시간과 비용을 줄이기 위해 더 짧은 프롬프트나 더 작은 모델과 같은 최적화를 도전할 수 있습니다.

     

    하지만, 이렇게 프롬프트 엔지니어링으로 잘 개발해도, 할루시네이션 때문에 AI 서비스 개발에 어려움이 있을 수 있습니다.  할루시네이션의 원인은 AI가 학습하지 않는 데이터는 대답하지 못해, 제공되는 정보가 부족하면 정확도가 떨어지는 답을 할 수 밖에 없기 때문인데요. 그래서 요즘 빅테크 기업들은 이 할루시네이션을 해결하기 위해서, 기업용 내부 데이터를 학습시키거나 실시간 외부 데이터를 가져올 수 있게 하는 기술인 ‘RAG(검색 증강 생성)’을 필수로 사용해 할루시네이션 현상을 최소화하고 있습니다. 

    3. RAG(Reinforced Acquisition Gateway)란 무엇일까요?

    검색-보강 생성(RAG)은 사용자가 프롬프트를 제출하고 LLM이 출력을 생성하는 사이에 중간 단계가 포함된 프롬프트 엔지니어링 기술입니다. 이 단계에서, LLM 기반 애플리케이션은 훈련에 포함되지 않았던 더 관련성 높고 품질이 높은 추가 정보를 검색합니다. 예를 들어 최근 검색 엔진 결과의 데이터(예: ChatGPT의 “Bing으로 탐색” 기능)와 기업의 지식 베이스에서 검색하는 맞춤형 GPT와 같은 독점 데이터셋입니다.

    결과적으로, RAG를 활성화한 애플리케이션은 재교육 없이도 더 관련성 높은 출력을 생성할 수 있으며, 발생할 수 있는 오류를 줄일 수 있습니다.

    여기서 그치지 않고 이왕 AI 서비스 만드는데, 앵무새같은 챗봇이 아닌 스스로 생각하고 행동하는 AI 에이전트를 만드는게 좋겠죠? 이러한 AI에이전트와 관련해서 빌게이츠는 “인공지능 Agent는 기술 업계와 사회 전반에 엄청난 영향을 미칠 것이며, 결국 미래는 AI 비서를 만드는 기업이 승리할 것이라고 말했습니다. 이렇듯 생성 AI기술이 끝없이 발전하면서 단순 채팅만 가능한 AI/LLM 서비스를 개발하는 것으론 경쟁력이 떨어지는 시대가 도래했습니다.

    4. 스스로 생각하고 행동하는  Agent 기반 AI서비스 핵심 기술 : Function Calling

    Agent 기반 AI서비스에는 여러 구현 방식이 있는데, 그중에서도 OpenAI에서 제공하는 ChatGPT API의 ‘Function Calling’ 기능이 핵심 방식 중 하나입니다! Function Calling은 AI 에이전트가 특정 기능이나 서비스를 실행하기 위해 외부 프로그램이나 라이브러리의 함수를 호출하는 과정을 말합니다. 이 과정을 통해 AI 에이전트는 다양한 데이터를 처리하거나, 외부 시스템의 정보를 가져오거나, 필요한 작업을 수행할 수 있습니다.

    예를 들어, AI 에이전트가 날씨 정보를 기반으로 사용자에게 옷차림을 추천하는 서비스를 제공한다고 가정해 봅시다. 이 경우, AI 에이전트는 날씨 정보를 제공하는 외부 API의 Function을 호출하여 현재 날씨 정보를 얻은 후, 그 정보로 사용자에게 적절한 옷차림을 추천할 수 있습니다.

    Function Calling을 통해 AI 에이전트는 자신의 기능을 확장하고, 다양한 작업을 보다 효율적으로 수행할 수 있게 됩니다. 이는 AI 에이전트가 보다 복잡한 문제를 해결하고, 사용자에게 보다 풍부한 서비스를 제공할 수 있게 하는 핵심 요소 중 하나입니다. 

    이렇게 2024년 LLM기반 AI서비스 개발 고도화의 핵심인 프롬프트 엔지니어링, RAG, Function Calling에 대해 알아보았는데요! 이러한 기술들 이왕 배울거면 프롬프트 엔지니어링부터 Function Calling까지 고도화해서 배우는게 중요하겠죠? 

    프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발을 9개 프로젝트로 알려주어  ‘네카라쿠배당토야’급 AI 서비스를 만들게 해주는 강의가 있습니다! 

    [프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발 : 9개 프로젝트로 챗봇부터 AI에이전트까지]

    이 강의는 무려 카카오 GenAI파트 리드가 메인 강사님이며 챗봇부터 ai 에이전트까지 모두 개발하실 수 있게 프롬프트 엔지니어링부터 RAG, Function Calling까지 모두 알려드립니다. 더불어 현직자분들이 자사 회사에 바로 만들어본 AI 서비스를 바로 도입할 수 있도록 API화해서 알려드리니 안배워볼 수 없겠죠?  쉽고 빠르게 AI 서비스를 개발할 수 있는 모든 것을 담았으니, 기회를 놓치지 마세요! 

  • OpenAI API, 2024년 실제 AI 서비스별 활용 사례 (ft. GPT-4V, DALL-E, Whisper…)

    OpenAI API, 2024년 실제 AI 서비스별 활용 사례 (ft. GPT-4V, DALL-E, Whisper…)

    입문자를 위한 Docker & Kubernetes 개념
    및 정석 학습법 (ft. 컨테이너 환경)

    #LLM

    #LMM

    #프롬프트엔지니어링

    #멀티모달

    ㅣOpenAI란?

    OpenAI는 디지털 지능을 책임감 있고 안전하게 발전시키려는 목표로 설립된 AI 연구 기관입니다. 그리고 OpenAI의 API는, 개발자들이 처음부터 모델을 구축하고 훈련할 필요 없이 AI 기능을 AI 서비스나 애플리케이션에 추가할 수 있도록 해주는 사전 훈련된 모델 및 도구 세트라고 할 수 있습니다. API는 감정 분석, 이미지 인식, 텍스트 생성, 언어 번역 및 챗봇을 포함한 다양한 기능을 제공하고 있어, 프로젝트 목적별로 필요한 최상의 API를 선택해야 합니다.

    그래서, 이 글에서는 OpenAI의 API를 활용해 구현 가능한 기능들을 설명하고 AI 서비스별로 대표적으로 사용된 실제 사례들을 소개하고자 합니다. 먼저, OpenAI의 API를 활용해 AI 서비스를 개발하는 게 이득인 이유를 알아볼까요?

    ㅣOpenAI API의 차별점과 장점

    OpenAI의 API는 시장의 다른 API와 구별되는 다양한 고유한 기능과 기능을 제공합니다.

    사전 훈련된 모델: OpenAI의 API는 사전 훈련된 모델을 사용하므로 개발자들은 빠르고 쉽게 AI 기능을 애플리케이션에 추가할 수 있습니다.

    사용자 맞춤화: OpenAI의 API는 각 비즈니스의 특정 요구 사항에 맞게 커스터마이징할 수 있습니다.

    통합: OpenAI의 API는 기존 애플리케이션 및 워크플로우에 쉽게 통합할 수 있습니다.

    확장성: OpenAI의 API는 스타트업에서 대기업에 이르기까지 모든 규모의 기업에서 사용할 수 있습니다.

    – 사용 사례  1 : 감정 분석(Sentiment Analysis)

    감정 분석은 고객 리뷰, 소셜 미디어 게시물 또는 설문 응답과 같은 텍스트의 감정 톤을 결정하는 과정으로, 감정 분석의 목표는 특정 제품, 서비스 또는 주제에 대한 화자 또는 작가의 전반적인 태도를 파악하는 것입니다.

    👍🏻감성 분석 활용 시 장점

    향상된 고객 환경: 감정 분석은 기업이 고객의 감정을 이해하는 데 도움이 되므로 경험을 개선하기 위한 조치를 취할 수 있습니다.

    향상된 제품 피드백: 감정 분석을 통해 기업은 제품 피드백에서 더 많은 통찰력을 얻을 수 있으므로 개선해야 할 부분을 식별할 수 있습니다.

    고객 참여도 증가: 감정 분석을 통해 기업이 고객과 보다 의미 있고 개인화된 방식으로 서비스에 참여할 수 있습니다.

    ✅실제 AI 서비스에 사용 사례

    우버: 우버는 고객의 피드백을 분석하고 라이더의 전반적인 경험을 향상시키기 위해 감정 분석을 사용합니다.

    아마존: 아마존은 제품과 서비스에 대한 고객의 의견을 이해하기 위해 감정 분석을 사용하며 고객의 요구에 맞게 개선할 수 있습니다.

    텍스트에서 감정을 분석하는 아마존 Comprehend 서비스 (출처 : Classmethod, ‘텍스트 감정 분석 서비스 Amazon Comprehend를 사용해 봤습니다’)

    – 사용 사례  2 : 이미지 인식(Image Recognition)

    이미지 인식은 이미지 또는 비디오에서 물체, 사람 또는 장면을 식별하는 것입니다.  대규모 이미지 데이터 세트에서 머신 러닝 모델을 학습시켜 특정 객체나 패턴을 인식할 수 있도록 만듭니다.

    👍🏻이미지 인식 사용 시 장점

    정확도 향상: 이미지 인식은 의료 진단, 보안 및 감시와 같은 다양한 응용 분야에서 정확도를 높이는 데 도움이 될 수 있습니다.

    시간 절약: 이미지 인식은 이전에 수동으로 수행했던 작업을 자동화하여 시간을 절약하고 효율성을 높일 수 있습니다.

    향상된 고객 환경: 이미지 인식은 기업이 고객에게 보다 개인화된 매력적인 경험을 제공하는 데 도움이 될 수 있습니다.

    ✅실제 AI 서비스에 사용 사례

    월마트: 월마트는 이미지 인식을 사용하여 재고를 식별하고 추적하는 프로세스를 자동화하여 시간을 절약하고 정확성을 향상시키고 있습니다.

    페이스북: Facebook은 이미지 인식을 사용하여 사진에서 친구를 자동으로 태그하여 사용자가 사진을 쉽게 찾고 공유할 수 있게 합니다.


    고객과 직원 경험을 최적화하기 위한 월마트의 Intelligent Retail Lab(출처 : Mobile Marketing Magazine, ‘Walmart is opening its first experimental “smart” store, powered by AI’)

    – 사용 사례  3 : 텍스트 생성(Text Generation)

    텍스트 생성은 입력 데이터 세트를 기반으로 새로운 텍스트를 자동으로 생성하는 기능입니다. 이는 대량의 텍스트 데이터에 대해 학습된 딥러닝 신경망과 같은 고급 기계 학습 모델을 사용하면 가능합니다.

    👍🏻텍스트 생성 사용 시 장점

    생산성 향상: 텍스트 생성은 이전에 수동으로 수행했던 작업을 자동화하여 시간을 절약하고 생산성을 높일 수 있습니다.

    향상된 고객 환경: 텍스트 생성은 기업이 챗봇 사용과 같이 고객에게 보다 개인화된 매력적인 경험을 제공하는 데 도움이 될 수 있습니다.

    향상된 창의성: 텍스트 생성은 기존 데이터를 기반으로 제안을 제공함으로써 기업이 새롭고 혁신적인 아이디어를 생성하는 데 도움이 될 수 있습니다.

    ✅실제 AI 서비스에 사용 사례

    OpenAI: OpenAI는 챗봇, 콘텐츠 제작, 언어 번역과 같은 광범위한 응용 분야에 사용할 수 있는 최첨단 텍스트 생성 모델인 GPT-3을 개발했습니다.

    GrubHub: GrubHub는 텍스트 생성을 사용하여 메뉴 생성 과정을 자동화하여 시간을 절약하고 레스토랑 파트너의 효율성을 높입니다.

    텍스트를 생성하는 GPT-3 사용 사례 (출처 : 인공지능신문, ‘GPT-3, 인류 역사상 가장 뛰어난 ‘언어 인공지능’이다’)

    – 사용 사례  4 : 언어 번역(Language Translation)

    언어 번역은 한 언어에서 다른 언어로 텍스트를 변환하는 것입니다. 대규모 텍스트 데이터 세트에서 학습된 기계 학습 모델을 사용하며, 한 언어에서 다른 언어로 텍스트를 정확하게 번역할 수 있습니다.

    👍🏻언어 번역 사용 시 장점

    글로벌 커뮤니케이션 개선: 언어 번역을 통해 기업은 다양한 국가 및 지역의 고객, 파트너 및 직원과 효과적으로 의사 소통할 수 있으므로 글로벌 커뮤니케이션이 개선됩니다.

    시장 도달 범위 증가: 언어 번역은 기업이 새로운 시장으로 확장하고 새로운 고객에게 도달하여 시장 도달 범위를 늘리는 데 도움이 될 수 있습니다.

    향상된 고객 경험: 언어 번역은 고객이 모국어로 정보와 지원에 액세스할 수 있도록 제공하여 보다 개인화된 매력적인 고객 경험을 제공합니다.

    ✅실제 AI 서비스에 사용 사례

    에어비앤비: Airbnb는 사용자에게 목록에 대한 번역된 설명을 제공하고 사용자를 다국어로 지원하기 위해 언어 번역을 사용합니다.

    우버: 우버는 고객들에게 모국어로 앱 내 지원을 제공하기 위해 언어 번역을 사용하여 고객들이 앱을 더 쉽게 사용하고 필요한 지원을 받을 수 있도록 합니다.

    채팅 번역을 지원하는 우버 앱 (출처 : techrecipe, ‘우버, 앱 안에서 구글 번역으로 채팅을…’)

    – 사용 사례  5 : 챗봇 및 가상 비서(Chatbots and Virtual Assistants) 

    챗봇과 가상 비서는 텍스트 기반 또는 음성 기반 대화를 통해 사용자와 상호 작용하도록 설계된 컴퓨터 프로그램입니다. 이러한 프로그램은 자연어 처리(NLP)와 기계 학습 알고리즘을 사용하여 사용자 입력을 이해하고, 응답하여 자동화된 고객 지원 및 서비스를 제공합니다.

    👍🏻챗봇 및 가상 비서 사용 시 장점

    향상된 고객 서비스: 챗봇과 가상 비서는 고객 문의에 빠르고 정확한 응답을 제공하여 전반적인 고객 서비스 경험을 향상시킬 수 있습니다.

    효율성 향상: 챗봇과 가상 비서는 반복적인 작업을 처리하고 연중무휴로 지원할 수 있어 직원들이 더 복잡하고 부가가치가 높은 작업을 수행할 수 있는 시간을 확보할 수 있습니다.

    개인화된 경험: 챗봇과 가상 비서는 데이터와 알고리즘을 사용하여 고객과의 상호 작용을 개인화하여 보다 매력적이고 관련성 있는 경험을 제공할 수 있습니다.

    ✅실제 AI 서비스에 사용 사례

    뱅크 오브 아메리카: 뱅크 오브 아메리카는 챗봇을 사용하여 고객에게 은행 질문에 대한 빠르고 정확한 답변을 제공하여 전반적인 고객 경험을 향상시킵니다.

    H&M: H&M은 챗봇을 사용하여 고객에게 맞춤형 스타일링 조언과 제품 추천을 제공하여 참여도와 매출을 높이고자 합니다.

     

    패션 기업 H&M의 디지털 스타일리스트 챗봇 (출처 : medium, ‘Conversational AI in eCommerce: 9 of the Most Successful Chatbot Examples’)

    이처럼 OpenAI의 API를 잘 활용하면 AI와 머신러닝의 힘을 활용하려는 기업 또는 서비스에게 다양한 가능성을 만들어 줄 수 있습니다. 이미지 인식 및 텍스트 생성부터 언어 번역 및 챗봇까지 오픈AI의 API는 기업이 혁신하고 곡선을 앞서가는 데 필요한 다양한 도구를 제공합니다.

    기업 규모에 상관없이 고객 서비스를 개선하려는 중소기업이든 복잡한 작업을 자동화하려는 대기업이든 OpenAI의 API를 사용할 수 있습니다. 때문에, 방대한 양의 데이터를 처리하고 정확한 결과를 제공할 수 있는 역량을 갖춘 OpenAI의 API는 점점 더 기술 중심적인 세상에서 기업에게 경쟁 우위를 제공할 것으로 예측되고 있습니다.

    그러니, 뒤쳐지기 전에 OpenAI의 유명 모델은 물론 다양한 LLM/LMM 기반 모델을 사용하여 AI 서비스를 개발하는 법을 배우고 싶다면 국내 최초로 LMM을 활용한 AI 프로덕트 개발까지 다루는 이 강의를 주목하세요!

     

    6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것

    : 프롬프트 엔지니어링부터 멀티모달까지

    AI? 프롬프트? 딥러닝? 모르셔도 괜찮습니다.
    AI 입문자도 LLM, 멀티모달 기반 어떤 AI 서비스든,
    이 강의에서 API&스택&기술 ‘조합’ 방법만 잘 배우면 개발 가능합니다!

    야*자, 파*고, 여기*때, 구*쇼핑 등
    가장 대표적인, 대중적인 LLM/LMM 기반 AI 프로덕트 6개를 총 80시간 동안, 기능부터 UI까지 99% 구현해봅니다.

    이미지 번역, 챗봇, 의류 가상 시착, 스피킹 연습 기능 등  AI 기능들을
    어떻게 실제 서비스와 똑같이 개발하고, 기존 서비스에 통합하는지 직접 경험해 보세요!

    > >강의 들으러 가기 >>

  • 입문자를 위한 Docker & Kubernetes 개념 및 정석 학습법 (ft. 컨테이너 환경)

    입문자를 위한 Docker & Kubernetes 개념 및 정석 학습법 (ft. 컨테이너 환경)

    입문자를 위한 Docker & Kubernetes 개념
    및 정석 학습법 (ft. 컨테이너 환경)

    #도커

    #쿠버네티스

    #MSA

    #백엔드

    #DevOps

    I IT 시장의 트렌드를 주도하고 있는 컨테이너 환경의 핵심, 

    Docker & Kubernetes

     

    최근, 한국에서는 물론 전 세계적으로 컨테이너 환경과 MSA 아키텍처를 채택하는 추세가 두드러지고 있습니다. 빠르게 진화하는 디지털 환경에서, 애플리케이션을 현대화하고 민첩성을 향상시켜 서비스의 경쟁력을 강화하기 위해 많은 기업들이 컨테이너 환경을 선택하고 있죠.

     

    실제 CNCF(Cloud Native Computing Foundation)에서 발표한 ‘CNCF 연간 서베이 2021’에 따르면, 전 세계 조직의 96%가 쿠버네티스를 이미 사용 중이거나 검토 중인 것으로 알려졌습니다. 

     

    이런 상황은 국내 IT 대기업들도 마찬가지로,  아래 모든 기업들은 전부
    MSA 아키텍처를 도입했거나 도입 중입니다!

    개발 환경 혁신을 위한 ‘열쇠’가 된 Docker & Kubernetes의
    개념과 장점은?

     

    먼저 도커란, 컨테이너 기반의 오픈소스 가상화 플랫폼입니다. 이는 응용 프로그램이 호스트 운영 체제와 분리되어 독립적으로 실행되도록 하는 가상화 방식입니다. 이를 통해 응용 프로그램을 서로 다른 환경에서도 일관되게 실행할 수 있고, 개발 환경과 운영 환경 사이의 차이로 인한 문제를 줄일 수 있습니다. 도커 컨테이너는 가볍고 빠르며 확장성이 좋아서 개발 및 배포 프로세스를 간소화하는 데 사용됩니다.

      

    [Docker의 장점]

    ✅ 일관성 : 애플리케이션을 컨테이너로 패키지화하여 이식성을 높이고, 환경을 일관되게 유지합니다.

    ✅ 배포 신속성 : 컨테이너화된 이미지의 작은 크기와 가벼움으로 배포 속도와 하드웨어 효율성을 높여줍니다.

    ✅ 자원 효율성 : 가상화된 환경보다 자원을 효율적으로 사용할 수 있도록 호스트 운영 체제와 자원을 공유합니다.

    쿠버네티스란, 컨테이너화된 워크로드와 서비스를 관리하기 위한 이식성이 있고 확장 가능한 오픈소스 플랫폼입니다. 이는 컨테이너화된 애플리케이션의 배포, 확장, 부하 분산, 로깅, 모니터링 등의 관리 기능을 자동화하여 개발자 및 운영팀이 애플리케이션을 효율적으로 운영할 수 있도록 지원합니다. 쿠버네티스는 애플리케이션의 성능, 가용성 및 확장성을 향상시키는 데 도움이 되며, 클라우드 환경에서 활용할 수 있는 많은 기능을 제공합니다.

    [Kubernetes의 특징]

    ✅ 배포 자동화 : 컨테이너화된 애플리케이션을 자동으로 스케줄링하고 배포하며, 장애 상황에 대비하여 자동으로 복구합니다.

    ✅ 오토스케일링 : 특정 컨테이너에서 갑작스런 부하가 발생할 경우 이를 감지하여 모니터링하며, 정해진 수준 이상을 초과하면 스케일 아웃하여 자동으로 컨테이너를 확장하여 부하를 분산시킵니다.

    ✅ 자동 복구: 쿠버네티스는 컨테이너나 노드의 장애를 감지하고 자동으로 복구 작업을 수행합니다. 이를 통해 시스템의 가용성을 높이고 장애 상황에 대비할 수 있습니다.

     

    Docker & Kubernetes의 개념 및 학습을 위해 꼭 챙겨야 할 포인트

    📌도커 학습 포인트

    Point1:  초보자는 설치부터 어렵다, 만만히 보지 말 것!

    도커는  운영체제 / 시스템 요구사항 / 네트워크 구성 / 호환성 문제 등 설치 과정에서도 이렇게나 고려해야 할 요소들이 많습니다. 계속 발생하는 오류에 고통받으며 설치에만 몇 시간씩 걸리시는 입문자분들이 많으신데요, 때문에 컴퓨터별 운영 체제와 버전을 적절하게 선택해서 설치하는 것이 필요합니다. 

     

    Point2:  명령어 무지성으로 달달 암기하지 말 것!

    물론, 주요 명령어를 암기하고 시작한다면 도커를 시작하는 데 도움이 될 수 있습니다. 하지만 도커는 단순히 명령어를 입력하여 사용하는 것보다 그 사용 방법과 원리를 이해하는 것이 중요합니다. 실무에서 제대로 사용하려면 도커 네트워크 관리부터 도커 볼륨 설정, 그리고 컨테이너 간 상호 작용에 이르기까지 다양한 요소를 이해하고 활용해야 합니다.

     

    📌 Kubernetes 학습 Point

    Point1:  지속 업데이트에 따라 계속 변화하는 특성을 고려할 것!

    쿠버네티스는 일 년에 세 번 새로운 버전을 출시할 만큼, 활발하게 유지 보수되는 프레임 워크입니다. 그래서 운영자는 주기적으로 버전 업그레이드를 통해 새롭게 등장하는 기능과 혜택을 활용할 필요가 있습니다. 또한, 새로운 버전과 호환되지 않는 플러그인, 라이브러리 등을 사용하고 있는 경우에는 시스템이 정상적으로 작동하지 않을 수 있습니다.


    Point2:  학습 난이도 높음 주의, 중간에 포기하지 말 것! 쿠버네티스는 복잡한 아키텍처와 다양한 개념 때문에 높은 진입장벽을 가지고 있습니다. 이렇게 어려운 쿠버네티스를 쉽게 배우기 위해선, 글보단 한 눈이 파악이 되는 이런 도식 자료를 통해 학습할 필요가 있습니다.

     

    또 관련 커뮤니티를 적극적으로 활용하여 쿠버네티스나 다른 기술적인 문제에 대한 해결책을 모색하는 것도 좋은 방법입니다. 이러한 온라인 커뮤니티에서는 다양한 전문가들과 개발자들이 모여 있기 때문에 새로운 관점과 아이디어를 얻을 수 있습니다. 

    하지만, 이보다 선배나 멘토가 있다면 더욱 빠르고 효율적으로 문제를 해결할 수 있습니다. 선배나 멘토는 자신의 경험과 전문 지식을 바탕으로 지원을 제공하고, 실제 문제에 대한 실질적인 해결책까지 제시할 수 있기 때문이죠.

    📌 제일 중요한 마지막 학습 포인트!

    가장 중요한 포인트는, 도커와 쿠버네티스를 각각 따로 배우지 말아야 한다는 것입니다. 도커와 쿠버네티스는 상호 연관성을 띠고 있기 때문에, 내용부터 연결되게 학습하고 이어서 프로젝트까지 경험해 보는 게 필요합니다. 특히, 요즘 소프트웨어 개발은 클라우드 네이티브 환경에서 대부분 이루어지고 있어 도커와 쿠버네티스 모두 클라우드 네이티브 개발 및 배포의 핵심 기술이 되었습니다. 때문에 도커와 쿠버네티스의 상호 연관성을 이해해 함께 활용할 줄 아는 것은 현대 개발자에게 필수 역량으로, 백엔드와 DevOps를 가리지 않고 어떤 개발자든 알아두어야 하는 스킬입니다.

    이런 포인트들 모두 고려하고 싶다면 

    이 강의로 Docker & Kubernetes 마스터할 것!

    ❇️도커 명령어만 달달 외우다 포기하지 말고, 차근차근 25시간 실력 빌드업!
    입문자를 위한 설치부터, 도커 이미지 생성 & 배포, CI 자동화까지 

    ❇️맨날 바뀌는 쿠버네티스는 원리 학습으로 탄탄 기초 완성!
    변하지 않는 동작원리와 핵심 아키텍처에 집중해 견고한 역량을 다져보세요

    ❇️실무 프로세스 그대로, 도커 > 쿠버네티스 연결한 MSA 프로젝트
    도커와 쿠버네티스의 상호 연관성을 알아야 실무 환경을 깊이 있게 이해할 수 있습니다!

    ❇️막힘없는 학습을 위한, 빅테크&대기업 교육 전문 강사님의 질의응답 채널!
    에러 뜨거나 답답한 순간이 있다면 언제든 물어보세요! 강사님이 직접 답변해 드립니다.

    >>강의 들으러 가기 >>

  • [2024 네카라쿠배 코딩테스트 합격을 위한 3가지 전략 | 단기 합격 꿀팁!]

    [2024 네카라쿠배 코딩테스트 합격을 위한 3가지 전략 | 단기 합격 꿀팁!]

    2024 네카라쿠배 코딩테스트 합격을 위한
    3가지 전략 | 단기 합격 꿀팁!

    #코딩테스트

    #파이썬

    #코딩테스트준비

    팀 네이버에서 2024 상반기에 소프트웨어 개발, 인프라, 보안 등 다양한 분야에서 인재를 모집하며, 상반기 공채가 본격적으로 시작되고 있습니다!

    요즘은 대부분 기업들이 코딩테스트를 보기 때문에 더욱 준비할 것들은 많아졌어요. 자기소개서 쓰랴, AI 역량 검사 준비하랴, 코딩테스트까지 챙길 게 너무나도 많죠?!

    개발자가 되기 위해선 꼭 필요한 코딩테스트! 그렇다고 무작정 준비하면 낭패 볼 수 있어요. 특히 네카라쿠배 코딩테스트는 타 기업대비 난이도가 어려운 편으로 평범하게 준비하면 절대 뚫을 수 없습니다. 

    합격을 위해 가장 중요한 것은 전략적인 준비입니다. 프로그래밍 언어 선택부터 목표하는 기업의 기출 문제 수준과 유형을 파악하고 기업 맞춤형 코딩테스트를 준비해야 빠르게 통과할 수 있답니다. 

    코딩테스트를 처음 준비하거나 단기 합격 전략을 알고 싶은 취준생, 이직러들!

    아래 3가지 전략들 가슴과 머리에 새기고 코딩테스트 합격 가보자고~

     

    2024 네카라쿠배 코테 단기 합격 전략


    1.
    프로그래밍 언어 선택: 코딩테스트 입문계의 절대강자 Python!

    ‘취준생들이 가장 많이 하는 질문 중 하나로 “아무 언어나 일단 시작하면 되죠?”라는 질문을 하곤 하는데요. 

    절대 아닙니다. 이렇게나 많은 프로그래밍 언어 뭘 선택해야 코딩테스트에 유리할까요?! 물론 본인에게 가장 친숙한 언어가 있다면 해당 언어로 진행하는 것이 좋지만, 아직 친숙한 언어가 없고 코딩테스트에 익숙하지 않다면 파이썬으로 준비하는 것이 가장 유리합니다. 

    아래처럼 파이썬의 대표적인 장점 때문에 2022년 프로그래머스의 설문조사에 따르면 가장 인기 있는 코딩테스트 언어 TOP 1에 올랐다고 해요! 

    <파이썬을 선택해야 할 이유>

    ✔️ 단순한 문법으로 읽고 쓰기가 쉬움

    ✔️ 다양한 분야와 직종에서 활용되어 범용성이 높음

    ✔️ 내장된 다양한 라이브러리와 도구를 제공해 효율성과 생산성이 높음

    ✔️ 가장 인기 있는 코딩테스트 언어로 레퍼런스 양 급증 중

     
     


    2. 프로그래밍 언어 선택: 코딩테스트 입문계의 절대강자 Python!

    코딩테스트를 무조건 양치기로 준비하시며 무작정 문제를 많이 푸시는 취준생분들 계실 텐데요. 실력은 늘겠지만, 우리에게 필요한 것은 취업 과정인 코테를 빨리 통과하고 취뽀를 하는 것! 이를 위해서는 기업별 코딩테스트 난이도와 빈출 유형을 파악해서 맞춤형 코딩테스트 준비가 필요해요.

    이처럼 실제 기업별로 난이도가 상이하고 빈출 되는 알고리즘들이 굉장히 다르답니다. 현재 내가 원하는 기업의 코딩테스트 출제 경향은 어떤지, 또 어떤 자료구조, 알고리즘이 필요한지 이해하는 것이 합격의 지름길!

     

    3. 단기 준비 전략: 출제자 의도 파악 필수!

    시중에 나와 있는 많은 문제, 강의, 책 뭐부터 봐야 할지 모르겠다고요?  아무리 많이 풀어도 출제자 접근법과 해결법을 훈련하지 않는다면 소용이 없습니다. 출제자의 관점으로 문제를 어떻게 접근해야 할지 또 어떻게 해결해야 할지를 알 수 있어야 문제 풀이 능력을 단기 성장시킬 수 있습니다. 





    이 3가지 전략들을 한 번에 다 준비할 수 있도록! 

    조건1. 코딩테스트에 가장 유리한 Python으로 준비할 것.

    →  파이썬 강의 따로 찾지 마세요! 문법 강의 10시간 한 번에 제공!

    조건2. 원하는 기업을 타겟팅한 문제와 모의고사를 챙길 것.

    → 기업 코테 난이도별 빈출 유형 300개 & 모의고사 6회

    → 주요 기업 코딩테스트 출제 경향 전략서

    → 매년 1회분씩 업데이트되는 트렌드 반영 모의고사

    조건3. 출제자의 접근법과 해결법을 완벽 습득할 것.

    → 삼성 코딩테스트 출제자의 이론 강의

    → 시간복잡도 감소를 위한 출제자가 알려주는 n가지 접근법

    → 출제자가 직접 손 글씨&그림으로 쉽게 이해하고 예제로 완벽 습득

    !시간이 촉박해요. 정말 이 많은 걸 단기로 가능할까요?!

    X걱정하지 마세요X

    코딩테스트라면 심장이 떨리는 코린이도 따라올 수 있게 단기 로드맵을 준비했어요!

    상황에 맞게 로드맵을 설정하고 효율적으로 코딩테스트 준비하세요.

     
  • 의료 AI 공부 어떻게 해야 하나요?

    의료 AI 공부 어떻게 해야 하나요?

    의료 AI 공부 어떻게 해야 하나요?

    #의료 AI

    #딥러닝 기술

    #의료 인공지능

    최근 AI 기술이 많은 분야에서 활용되고 있죠. 그 배경에는 다양한 머신러닝, 딥러닝 기술이 있습니다 . 의료 AI는 의료 임상 현장에 AI 기술을 도입하는 것인데요. 사람의 생명과 직결되는 특수 분야이기 때문에 다른 분야에서 AI를 활용하는 것과 차이가 있습니다. 의료 도메인에서 AI는 어떻게 활용되며, 의료 AI 학습은 어떻게 접근해야 하는지 의료 AI 분야에서 다양한 연구를 진행해보신 국승호 연구원님께 여쭤봤습니다.

    안녕하세요. 간단히 소개 부탁드립니다.

    안녕하세요. 이번에 강의를 맡게된 Cook입니다. 대학병원에서 3년간 연구원으로, 바이오 산업계에서 전문연구요원으로 일해왔습니다. 그후 포트래이라는 공간전사체 분석회사에서 AI 기술을 담당하고 있습니다. 대학원 기간과 산업계를 경험하는 동안 저는 다양한 의약 바이오 인공지능 연구 프로젝트를 진행하였습니다.

    신약 개발 딥러닝, 단백질 구조 예측, 암 환자 아종 구분 등 최신 다양한 의료계와 제약회사에서 관심을 갖는 연구를 진행한 경험이 있으며, 수많은 의료기관과 제약회사들과 많은 협업 프로젝트를 진행했습니다. 의료 인공지능 관련 Nature 자매지 제 1저자 및 그 외 다수 논문을 저술했습니다.

    요즘 의료 AI가 많은 주목을 받고 있어요.
    실제로 어떤 성공 사례들이 확인되고 있나요?

    인공지능이 풀 수 있는 문제 중 가장 고부가 사업이 의료바이오 쪽이죠. 실제로 지금 이 분야에서 많은 시도가 이루어지고 투자가 이루어지고 있는데요. 실제 의료 문제에 AI를 적용하면 시간적, 경제적 비용을 상당히 줄일 수 있어요. 일단 영상 분야에서는 미숙련된 영상의학과, 병리과 의사를 대체할 정도의 수준이 되어 자동화 시스템으로 환자를 진단이 가능합니다. 영상과 오믹스데이터로 환자를 진단하거나 환자별 맞춤형 치료를 하고, 새로운 치료방법을 제시하기도 합니다. 또한 엄청나게 비용적으로 비싼 값을 치르는 분석장비를 통해서만 알아낼 수 있는 결과치를 인공지능을 통해서 값싸게 환자를 진단할 수 있는 경우들도 생기고 있습니다.

    그리고 인공지능으로 신약을 개발한 사례가 좋은 저널에 실려서 많은 사람들이 인공지능 신약개발 사업과 투자에 뛰어들기도 하였습니다. 특히 최근 주목 받았던 것은 신약후보군이 될 수 있는 저분자화합물과 단백질과 결합력을 예측하는 기술입니다. 신약후보군을 찾을 수 있는 기술이라고 할 수 있습니다. 신약을 찾는 것뿐 아니라 신약개발의 전체 주기에도 많은 영향을 끼치며 이 한 단계 한 단계 모두가 하나의 산업계의 아이템이라고 할 수 있습니다.

    < 의료 이미지를 통한 AI 진단 시스템 >

    Computer vision, NLP, Graph 등 대표적인 딥러닝 기술을 활용하여 의료 데이터를 분석하고 유의미한 결과물을 도출해낼 수 있습니다.

    AI 기술을 적용하여 영상 이미지 분류 및 분석하여 다양한 질환을 정확히 진단하고 치료 방법을 찾아낼 찾아낼 수 있습니다.

    <환자의 치료 Target 유전자 도출 >

    다양한 단백질 구조와 특정 화학 결합물 데이터를 바탕으로 수많은 결합&예측 시나리오를 확인하여 새로운 신약 물질을 개발할 수 있습니다.

    딥러닝 기술을 통해 drug-target 결과를 예측하는 다양한 모델 접근 방식을 만들고 찾아내어, 최적의 결과물을 만들어 낼 수 있습니다.

    의료 분야에 인공지능 기술을 적용하는 것은
    다른 도메인에 적용하는 것과 어떤 점이 다른가요?

    일단 의료에 AI 기술을 적용하려면 의료데이터에 대한 이해가 필수적이라고 할 수 있습니다. 어떻게 데이터를 활용할지 정하고 이해하고 그에 맞게 데이터를 가공하고 수집하는 과정이 무엇보다 중요하다고 할 수 있습니다. 그래서 어느정도 모델링 지식이 쌓이면 도메인 지식을 쌓고 도메인 전문가와 협업하는 것이 굉장히 중요하고, 일반적으로 데이터 부족현상이 있기에 그것을 해결하고자 하는 노력이 필요합니다.

    이 분야를 공부하는 사람들이 가장 어려워하는 부분은 어떤 부분일까요?
    이 강의가 어떻게 해결해줄 수 있을까요?

    의료 AI에서 많은 분들이 가장 많이 겪는 어려움은 데이터나 창업 아이템은 있지만 실제로 구현하기 힘들다는 것일텐데요. 이 강의에서 그런 부분에 대한 해결책을 어느 정도 가져가실 수 있을 것 같습니다. 이 강의는 수강생들이 어떤 데이터를 가지고 있고, 그 데이터에 알맞은 모델을 선정하고 모델을 구현하고 평가하는 과정에 필요한 개념과 실전 구현 방법을 담았습니다. 수강생분들이 어떤 분야에서 어떤 데이터를 만나 어떻게 활용할지는 모르겠지만, 해당 강의의 내용을 자신의 프로젝트에 맞게 잘 바꾸어 활용한다면 굉장히 많은 효과를 볼 수 있다고 생각합니다.

    이번 강의에서 알려주실 인공지능 기술은 어떤 것인가요? 파트별로 간단하게 설명 부탁드립니다.

    Part를 4개로 나눴습니다. Part1에는 전반적인 의료 바이오 인공지능에 대한 설명과 다른 Domain에 적용할 때와 다른 점들 그리고 수강에 필요한 머신러닝, 딥러닝 지식들을 다룹니다. 이런 기본적인 수강에 필요한 지식들을 기반으로 가장 간단한 Multi Layer Perctron 모델을 기반으로 Drug Toxicity를 예측하는 모델을 실습할 수 있습니다.

    그 이후에 진행될 나머지 3가지 Part에서는 각각 컴퓨터비전, 자연어처리, 그래프딥러닝에 대한 이론과 의료 바이오분야에 적용사례에 대해서 다룹니다. Part 2에서는 컴퓨터 비전에서 주로 사용되는 convolutional neural network(CNN) 모델에 대해서 배우고, CT, Histology image에 실습할 수 있습니다. Part 3에서는 자연어처리에서 주로 사용되는 recurrent neural network(RNN), Transformer에 대해서 배우고, Drug-Target interaction, Cancer Vaccine 데이터에 실습할 수 있습니다. Part 4에는 Graph 데이터란 무엇이고 의료 데이터 분야에 Graph는 어떤 것들이 있고 Graph 데이터를 어떻게 딥러닝으로 모델을 만들수 배우고 Drug와 BioNetwork에 적용하고자 합니다.

    강의에서 어떤 실습을 다룰 예정이신가요?

    강의 내 실습들에서는 최근 의료 제약 업계에서 주목 받고 있으며 대표적인 딥러닝 기술들을 적용할 수 있는 문제들로 구성했습니다. 하나하나가 최근 스타트업들의 창업아이템으로 선정되는 실제 문제를 기반으로 실습이 진행됩니다. 일단 Pytorch 딥러닝 라이버러리 사용법을 배울 것이며 그 배운 내용을 기반으로 다양한 의료바이오 데이터에 적용할 생각입니다. 그 예시로는 화합물의 특성을 예측해서 신약개발의 속도를 빠르게 할 수 있는 것과 의료영상으로 암환자와 코로나환자를 진단하는 것 그리고 저분자화합물, 단백질 치료제 예측 등이 있습니다.

    본 강의를 들었을 때 수강생들이 확실히 얻어갈 수 있는 것이 무엇일까요?

    본 강의를 통해서 확실히 얻어갈 수 있는 것은 무엇보다 머신러닝 딥러닝이 어떻게 이 분야에 활용되고 어떻게 이 하나하나의 기술이 코드로 구현되는지를 배울 수 있는 것이라고 생각됩니다. 실제로 데이터는 있지만 구현하지 못하는 연구그룹들이 굉장히 많은 것으로 알고 있습니다. 그런 부분에서 답답한 마음을 해소시켜줄 수 있을 것이라고 생각합니다.

    이 강의는 어떤 분들이 들으면 좋을까요?

    다양한 수강생들에게 도움이 될 거 같습니다. 실제 의료바이오 도메인 지식과 데이터는 있지만 그 데이터를 어떻게 머신러닝 관점에서 프로젝트를 진행했으면 하는 사람들이 가장 먼저 생각납니다. 그리고 간단한 머신러닝 딥러닝 기술들은 알고 있지만 컴퓨터 비전, 자연어, 그래프 등 다양하게 사용하지 못하는 수강생들에게도 적합할 거 같습니다. 물론 다양하게 전반적인 내용을 다루기에 조금은 어려울 수 있지만 머신러닝과 딥러닝에 대한 지식이 부족한 사람도 수강할 수 있게 강의를 구성하였습니다. 또한 투자자나 경영의 관점에서 해당 기술에 대한 지식을 쌓는데도 많은 도움이 될거 같습니다.

    마지막으로 이 업계에서 성장하고 싶은 강의 수강생분들에게 한 마디 부탁드립니다.

    주목 받는 인공지능이 적용될 수 있는 분야는 인류에 얼마나 기여하는가에 기인하는 거 같습니다. 자율주행, 주가예측, 신소재 개발, 무인시스템, 건축 등 다양한 분야에 연구가 진행되지만 그 중 가장 큰 가치를 갖는 것은 인간의 생명과 관련된 의약 바이오 계열이라고 생각합니다. 저는 인공지능과 의약 바이오과 결합한 융합기술이 질병으로 절망하는 환자들에게 희망을 줄 수 있다는 믿음을 가지고 평생을 이 분야에 헌신할 생각합니다. 그런 희망찬 미래에 함께 하실 수강생 분들을 응원하고 함께 하고싶습니다.

    의료 딥러닝 기술과 모델에 대해 배워보세요!

    의료 데이터를 활용한 바이오 진단 & 신약 개발 모델 구현

  • 스테이블 디퓨전과 ‘로라’의 모든 것:특성부터 이슈까지

    스테이블 디퓨전과 ‘로라’의 모든 것:특성부터 이슈까지

    AI

    :ing

    2024. 03. 10

    스테이블 디퓨전과 ‘로라’의 모든 것:특성부터 이슈까지

    “AI는 창조성의 민주화를 가져올 거예요.
    이미 모든 사람이 소셜 미디어를 사용하고, 모두가 콘텐츠 제작자입니다.
    그리고 이제 창작의 장벽이 아예 무너졌어요.
    그동안 창의적이지 못해 좌절했던 사람도 창의적일 수 있을 거예요.
    물론 그만큼 크리에이티브에 대한 기준도 높아지겠죠.”

    -대런 휘트니 디자인 스튜디오 디지털 디자인 디렉터, 2022년 크리에이티브 리뷰 인터뷰에서

    넷플릭스, 인공지능 관련 인재 선발한다

    대화형 AI인 챗gpt 뿐 아니라 이미지 생성형 AI에 대한 관심이 엄청난 요즘입니다. 단 몇 개의 단어만으로도 사용자가 원하는 뛰어난 퀄리티의 이미지를 뚝딱 만들어내는 인공지능. 이미지 생성 AI 업계에서는 현재 오픈AI의 ‘달리(DALL·E)’, ‘미드저니(Midjourney)’, 어도비의 ‘파이어플라이(Firefly)’, 스테이블AI의 ‘스테이블 디퓨전(Stable Diffusion)’ 등이 치열하게 경쟁하고 있죠. 산업과 직무를 불문하고 어디에서나 인공지능의 활용 범위가 높아지리라는 기대는 이미 현실로 바뀌고 있습니다. 이를 증명하듯 넷플릭스 소유의 VFX 스튜디오에서 인공지능 관련 여러 포지션의 채용 공고를 냈는데요. 이제 생성형 AI의 활용은 옵션이 아니라 필수가 된 듯하네요. 이 똑똑한 툴을 얼마나 잘 활용해 자신만의 결과물을 만들고 업무에 적용할지, 실무자들의 창의력이 관건이겠지요. 내게 지금 가장 필요한 인공지능을 선택해 배우는 것이 중요할 텐데요. 그렇다면 요즘 가장 주목받고 있는 생성형 AI들을 비교해 보아야겠죠?

    달리, 미드저니, 그리고 스테이블 디퓨전

    현시점에서 가장 각광받고 있는 이미지 생성형 AI로는 달리(DALL*E), 미드저니(Midjourney), 스테이블 디퓨전(Stable Diffusion)이 있습니다. 달리는 사용자의 주문대로 ‘모범생’스럽게 정확히 이미지를 구현해 내는 것이 특징입니다. 미드저니는 섬세하지는 않지만 ‘때깔’ 좋은 이미지를 수월하게 생성해낼 수 있고요. 스테이블 디퓨전의 경우 실사에 가까운 이미지를 뽑아내는 상당한 수준의 기술력이 인상적입니다. 이외에도 일본풍의 애니메이션 느낌을 풍기는 이미지가 필요할 때 적합한 NobleAI가 있죠.

    그림 AI시대를 열다, ‘스테이블 디퓨전’의 장점

    앞서 언급한 것처럼 가장 세밀한 컨트롤이 가능한 것으로 알려진 AI는 단연 스테이블 디퓨전입니다. Stable Diffusion은 독일 뮌헨 대학교의 Machine Vision & Learning Group 연구실이 여러 곳의 투자를 받아 개발한 딥러닝 인공지능 모델이거든요. 컴퓨터 사용 리소스를 크게 줄였다는 점이 다른 인공지능과의 확연한 차이죠. 무엇보다도 과감하게 오픈 소스로 공개했기에 모두가 접근 가능하다는 점이 엄청난 장점입니다. 앞서 간단히 언급한 것처럼 이미지를 구현하는 데 있어 아주 세밀한 디테일을 잘 살리는 다양한 기능을 갖추고 있고, 여전히 새로운 기능이 개발되고 있다는 점 역시 엄청난 경쟁력이라고 볼 수 있겠습니다. 뿐만 아니라 방대한 데이터를 학습하며 실사에 가까운 이미지를 뛰어난 퀄리티로 만들어 냅니다. 지난 2023년 7월에는 기존 SD 1.5보다 매개변수가 6배 가까이 늘어난 SDXL 버전이, 11월에는 1초 만에 3단계 이미지를 생성하는 SDXL 터보가 공개됐습니다. 

    이렇게 대중성과 편리함에 신속함까지 모두 장착한 스테이블 디퓨전은 그림 AI의 시대를 열었다고 평가받고 있습니다. 이것이 오늘 글의 주제로 ‘스테이블 디퓨전’을 선택한 이유이기도 합니다. 

    대체 AI가 어떻게 그림을 그려내는 걸까?

    그런데 대체 인공지능이 어떻게 그림을 그려내는 것일까요? 원리는 이렇습니다. 사용자가 텍스트로 작업 지시를 내리면 AI는 여기에 걸맞는 이미지를 만들어 냅니다. 스테이블 디퓨전(Stable Diffusion)의 경우 딥러닝 알고리즘을 통해 특정 이미지에 무작위의 노이즈를 추가하고 제거해 가며 명령값에 맞는 이미지가 무엇인지 예측하는데요. 이런 작업이 매끄럽게 가능하려면 인공지능이 메시지(텍스트)와 연결되는 이미지의 예시를 다양하게 학습해야만 하겠죠. 바로 이 지점에서 인공지능은 엄청난 데이터를 필요로 할 수밖에 없습니다. 인터넷 속 무궁무진한 정보의 바다에서 수많은 이미지와 텍스트를 무작위로 섭렵하며 이미지 생성 기술을 스스로 고도화하는 것이죠.

    이런 어마어머한 학습량은 분명 대체 불가능한 장점이지만 문제점 역시 불러일으켰습니다. 지난 2023년 초, 시애틀에 본사를 둔 스톡 포토 에이전시 게티 이미지 측이 스테이블 디퓨전 개발을 지원한 기업 ‘스태빌리티 AI’를 상대로 소송을 제기하는 일이 있었거든요. 스태빌리티 측이 동의를 구하지 않은 채 수백만 장의 이미를 불법적으로 이용했다는 이유였어요. 자세한 얘기는 글 후반부에서 다시 다루겠습니다.

    스테이블 인퓨전 모델 : 로라, 드림부스, 텍스트 인버전

    스테이블 디퓨전을 검색하면 로라(LoRA, Low-Rank Adaptation)에 관한 질문이 다양하게 뜹니다. 많은 분들이 관심을 보이는 ‘로라’는 무엇일까요? 간단히 설명하자면 로라(LoRA)는 대상을 세부 조정하기 위한 학습 기법 중 하나입니다. 스테이블 디퓨전에는 로라 말고도 드리부스나 텍스트 인버전 같은 다양한 학습 기법이 있는데요. 이 중에서도 로라는 그림체의 세부적인 얼굴, 자세, 배경 등을 결정짓는 모델이라고 할 수 있습니다. 드림부스가 뛰어난 성능임에도 부담스러운 크기이고 텍스트 인버전은 파일 크기가 작은 대신 기능의 제약이 많다는 것을 감안하면, 아마 대부분의 이용자들에게 로라가 가장 적절한 대안일 겁니다. 로라는 이 두 학습 기법의 중간쯤이거든요. 저장 용량이 왜 중요한 건지 궁금해하실 분도 계실 텐데요. 스테이블 디퓨전을 사용하다 보면 저장 용량의 중요성을 절실하게 느끼게 됩니다. 원하는 모델을 모두 사용하려면 파일 크기의 압박이 상당해지기 때문이죠. 그러니 부담스럽지 않은 용량에 보통 이상의 학습 능력인 로라가 좋은 선택이 될 수밖에요.

    로라, 이미지에서 이미지를 창조해 내다

    스테이블 디퓨전에서 로라를 활용하면 수십 장의 이미지로 대상을 학습시킨 뒤 해당 그림체를 흉내 내어 새로운 작품을 뽑아낼 수 있습니다. 텍스트 명령으로 새로운 이미지를 구현하는 데서 더 나아가 이미지에서 이미지를 재창조해 내는 것이죠! 그러니 유명 작가의 작품이나 맘에 드는 그림을 로라를 이용해 리터치해서 나만의 새로운 작품을 탄생시킬 수 있습니다. 물론 이 지점에서 윤리적 문제가 발생합니다. 이렇게 만들어진 작품의 저작권이 어느 쪽에 가야 할지에 대해서 사회적 논의가 필요한 시점입니다. 스테이블 디퓨전과 로라뿐 아니라, 생성형 AI 때문에 빚어진 문제들이 사회 이곳저곳에서 터져 나오고 있거든요.

    소송에 휘말린 스테이블 디퓨전

    사실 블룸버그는 이미 지난 2023년 한 해가 인공지능에서 비롯된 저작권이나 소유권 등 법적 갈등이 본격적으로 시작되리라 예상한 바 있습니다. 그리고 블룸버그의 예측이 옳았어요. 지구촌 곳곳에서 여러 논란이 불거졌거든요. 주요 이미지 생성 AI의 개발사들이 소송에 휘말렸습니다. 앞서 게티 이미지 측에서 스테이블 디퓨전 개발사에 소송을 걸었다는 소식을 말씀드렸죠? 게티 이미지가 지적한 문제는, 스테이블 디퓨전이 동의 없이 이미지 스크래핑을 했을 뿐 아니라 게티이미지의 유료 소스 워터마크를 재현하려는 경향이 보인다는 점이었어요. 뿐만 아니라, 스테이블 디퓨전의 로라로 모 작가의 작품이 훔쳐져 재생산되어 논란이 되기도 했습니다.

    이 사건이 끝이 아닙니다. 미드저니의 설립자가 동의 없이 수억 개의 이미지를 사용했음이 인터뷰를 통해 드러나자, 이들을 향한 대규모 집단 소송 역시 벌어지기도 했습니다. 동의 없이 가져간 저작물로 상업적 이윤을 얻은 행위가 공정하지 않다는 주장이었죠. 문제는 여기서 끝나지 않았어요. 스페인에서는 생성 AI를 이용해 아동 포르노를 만든 프로그래머가 검거되는 일이 생기고야 말았습니다.

    인공지능이 불러온 사회적 파장

    생성형 AI의 등장은 인간이 꿈꾸던 편리한 핑크빛 미래와는 거리가 있습니다. 인공지능의 등장으로 인간 일러스트레이터들이, 더 나아가 그들의 독창성이 생계를 위협받고 있으니까요. 누군가는 온라인 상에 올라와 있는 작품을 허가도 받지 않은 채 스테이블 디퓨전 같은 툴로 만져 여기저기서 자신의 작업물로 활용하고 있습니다. 꼭 저작권 문제가 아니더라도 앞으로 더 다양한 곳에서 인공지능으로 인한 문제가 일어나겠죠. 그때마다 이성적이고 지혜로운 사회적 합의가 필요할 테고요.

    생성AI 기술은 계속 범용화할 겁니다. 
    그렇기 때문에 기술을 이길 수 없는 일은 하면 안 돼요. 
    대신 인간만이 할 수 있는 숙고를 해야 합니다. 
    가끔 인공지능이 인간의 창의성마저 앞지르지 않을까? 걱정하는 분도 있습니다. 
    하지만 관점은 하나의 키워드가 아니라, 무수한 숙고의 조합에서 나와요. 
    그렇기 때문에 하나의 생각은 굉장히 깊습니다.
     그 사람만이 할 수 있는 것들이 분명히 있어요. 그걸 찾아 나가야 합니다.

    -송길영 <폴인> 인터뷰 중에서

    스테이블 디퓨전, 일단 배움이 먼저!

    생성형 인공지능 기술의 탄생은, 마치 스마트폰의 처음 등장과도 비슷한 혁명과도 같은 사건임이 분명합니다. 그럼에도 전문가들은 생성 AI가 인간을 완벽하게 대체하지 못할 거라고 내다봅니다. 인공지능에게는 인간만이 가진 관점과 취향, 기교나 감정이 없으니까요. 결국 생성 AI를 잘 다뤄서 스스로의 창의성에 날개를 다는 사람들이 레이스에서 승자가 되겠지요. 그런 면에서 <폴인> 인터뷰에서 송길영 부사장 님이 밝히신 내용이 인상적입니다. AI를 다루고 배우는 것은 무척 중요하지만, 가장 중요한 점은 인공지능을 활용하면서도 ‘왜’에 대한 고민을 멈추지 않으며 나만의 장르를 만들어내는 것이 중요하다는 사실. 스테이블 디퓨전을 비롯한 어떠한 생성 AI도, 인간에게 그저 도구일 뿐이죠. 철학 없이 도구만 쥐는 사람들에겐 인공지능과 함께하는 미래가 오히려 위기가 될 겁니다. 

    그러니 우리, 걱정은 멈추고 먼저 배워 보아요!
    앞으로는 AI를 충실히 배우고 치열하게 고민하는 사람들에게 주도권이 넘어갈 테니까요.

  • ai가 만든 광고, 여기 다 모였다!

    ai가 만든 광고, 여기 다 모였다!

    AI

    :ing

    2024. 03. 10

    ai가 만든 광고, 여기 다 모였다!

    글로벌 투자은행(IB) 골드만삭스는 2035년까지 미국의 전체 직업군의 약 50%를 AI로 자동화할 수 있다고 전망했습니다. 변화에 민감한 IT 기업들은 이미 비사업부 부서부터 순차적으로 AI를 적용하고 있습니다. 국내에서도 이메일, 자료요약, 번역 등 AI로 처리할 수 있는 업무 범위가 확대되고 있습니다. 사람들은 AI 프로그램에 명령어를 입력하는 것만으로도 전보다 빠르게 원하는 제목과 이미지를 만들 수 있습니다.

    이렇게 AI가 단순 문답이 아니라 창의력 영역까지 넘어오면서 특히 활약하는 분야가 바로 광고입니다. 최근 2,3년 사이 많은 기업들이 오로지 ai 광고(ai generated ad)를 제작하고 있습니다. 아직까지 ai 광고는 때로는 어색한 이미지를 연출하기도 하지만 향후 장기적으로는 사람을 대체할 미래 광고시장 또는 엔터테인먼트로 불리며 많은 관심을 받고 있는데요. 오늘은 재밌는 ai 광고를 한데 모아봤습니다.

    글로벌 AI 광고 사례

    1) 코카콜라 (Coca-cola)

    2023년 3월 코카콜라는 ‘Masterpiece’라는 제목의 ai 광고를 선보였습니다. 영상이 시작되면 미술관 여기저기에 앉아 스케치를 연습하는 미술학도들이 등장합니다. 이때 한 그림에서 목각 인형이 팔을 쭉 뻗으며 앤디 워홀의 작품 속의 콜라를 꺼내 다른 그림의 인물에게 건넵니다. 이런 방식으로 콜라는 다양한 작품을 거치다가 박물관에서 그림을 그리고 있던 남자에게 최종 전달됩니다. 이 광고에서 주목할 부분은 바로 코카콜라 병입니다. 다른 작품으로 이동할 때마다 디자인이 달라지는데요. 코카콜라는 이를 위해 스테이블 디퓨전이라는 AI 모델을 활용했습니다. 유명 명화와 데이터를 딥러닝시켜서 예술품의 고유한 스타일에 맞게 디자인을 변경할 수 있었습니다.

    2) 하인즈 (Heinz)

    2021년 하인즈는 자신들의 브랜드 가치를 입증하고자 실험을 기획했습니다. 정체를 밝히지 않고 전세계 소비자에게 케찹을 그려달라고 요청했고, 놀랍게도 많은 사람들이 하인즈 케찹 병을 그렸습니다. 2022년 하인즈는 여세를 몰아 오픈AI가 만든 달리 2(Dalle 2)를 활용해 똑같은 실험을 진행합니다. 달리 2는 입력한 명령어에 기반해 그림을 그려주는 생성형 ai 입니다. 하인즈는 ‘케첩과 르네상스’처럼 엉뚱한 조합의 키워드를 입력해 이미지를 요청했습니다. 결과는? 또 한번 놀랍게도 어떤 조합으로 키워드를 입력해도 하인즈 케찹을 활용한 이미지가 완성되었어요. ‘당신이 무엇을 검색하든 케찹은 하인즈다!’ 하인즈는 실험 과정에서 얻은 이미지로 ai 광고를 제작해 호평을 얻었습니다.

    3) 하디스 (Hardee’s)

    햄버거 기업 하디스 역시 AI 소프트웨어 달리를 활용해 ai 광고를 제작했습니다. 하디스는 달리에게 하디스가 만든 버거 ‘슈퍼스타’를 그려달라고 입력했습니다. 그런데 달리가 보여준 이미지들은 굉장히 조악했습니다. 이후에도 하디스는 무려 1만법이나 최대한 자세하게 슈퍼스타 버거의 이미지를 묘사했지만 결국 원하는 그림을 얻을 수 없었습니다. 하디스는 이 과정을 광고에 담고 “그냥 우리 레스토랑에 와서 슈퍼스타를 먹어봐”라고 말합니다. #UnAimaginable, AI가 상상할 수 없는, 이라는 인상적인 해시태그와 함께요. 하디스 광고는 아직 현재진행형인 AI의 구현 수준을 활용한 역발상 사례라고 볼 수 있습니다.

    4) 이토엔 (itoen)

    2023년 9월 일본 기업 이토엔은 자사 제품 ‘오이오차 카테킨 녹차’의 리뉴얼에 맞춰 새로운 TV 광고를 공개했습니다. 혹시 이 광고에 등장한 여성이 AI로 만들었단 사실, 눈치채셨나요? 광고 모델은 일본의 AI 전문 기업 AI model 만든 가상입니다. 광고는 ‘미래의 자신은 지금부터 시작한다’는 대사가 나오면서 흰머리의 여성이 젊은 여성으로 바뀝니다. 이토엔 측은 한 사람의 여러 모습을 표현하기 위해서 AI 모델이 최적이었다고 밝혔는데요. 광고는 출연 배우가 AI 모델이란 사실이 알려지면서 뒤늦게 화제가 되었습니다. 아울러 이 광고는 일본 TV 광고 사상 최초의 ai 광고 사례이기도 합니다. 보수적이기로 유명한 일본 광고계도 AI 바람이 불고 있는 것일까요?

    이밖에도 기업이 직접 만든 ai 광고는 아니지만 엘론 머스크를 비롯해 많은 관심을 낳았던 영상도 있습니다. 2023년 유튜버 데몬플라잉폭스(demonflightfox)는 해리포터를 활용해 만든 발렌시아가(Balenciaga) 밈 3편(123)을 공개했습니다. 그는 미드저니를 비롯한 4가지 AI 프로그램을 활용해 영상을 제작했다고 밝혔습니다. 영상에는 애니메이션으로 구현된 주인공들이 발렌시아가의 옷을 입고 등장합니다. 그들은 “해리, 너는 마법사야(You’re a Wizard, Harry)” 대신 “해리, 너는 발렌시아가야(You’re a Balenciaga, Harry)”라고 말하는 등 언어유희를 즐기죠. AI가 위트를 구사하는 모습이 어딘지 낯설면서 신기합니다.

    3. 국내 기업 ai 광고 사례

    1) 롯데

    올해 초 롯데는 생성형 AI를 사용해 만든 신년 영상을 공식 유튜브 채널을 통해 공개했습니다. 해당 영상은 30초 분량으로 ‘새해 희망’을 주제로 제작되었습니다. 광고 대행사 측은 이번 영상에서 생성형 AI는 텍스트, 이미지, 영상, 음악까지 광고의 모든 제작 과정에 활용되었다고 하는데요. 이렇게 AI를 전체 과정에서 골고루 활용해 실사 필름을 제작한 것은 국내에서 이번이 처음이라고 합니다. 최근 롯데는 AI를 화두로 삼고 업무에 적용하는 데 힘을 쏟아온 것으로 전해졌습니다. 롯데백화점은 AI로 만든 2024년 봄 시즌 비주얼 이미지를 공개하기도 했습니다.

    2) 11번가

    11번가는 자사 프로모션 ‘지금, 바캉스를 준비할 때’에 미드저니를 활용한 이미지를 활용했습니다. 11번가는 앞서 진행한 ‘창고대개방’ 행사에도 AI가 생성한 이미지를 활용한 바 있습니다.  11번가는 프로모션 뿐만 아니라 다양한 이미지를 AI로 만들어내고 있습니다. 보통 원하는 이미지를 얻을 때까지 수정 명령어를 입력하고 생성한 이미지는 디자이너의 후작업을 거쳐 완성한다고 합니다. 향후에는 후작업 과정까지 디자이너 없이 생성형 AI를 활용하는 방안도 검토중인 것으로 알려졌습니다.

    3) 베스킨라빈스

    2023년 3월 베스킨라빈스는 국내 최초로 챗 GPT를 활용해 동화 컨셉의 광고를 선보였습니다. 이어서 4월에는 2번째 광고를 선보였습니다. 2편 모두 이야기는 평범하지만 챗 GPT가 시나리오를 작성한 광고라는 점에서 주목을 끌었습니다. 특히 인기 캐릭터 산리오와 협업하면서 더욱 화제를 모으기도 했죠. 실제로 작년 6월 구글 기준 ‘챗GPT 마케팅’이라는 키워드 검색량 가운데 배스킨라빈스가 절반 이상을 차지했습니다. 2편의 광고를 통해 베스킨라빈스는 SPC 전체 브랜드 이미지를 쇄신하는 긍정적인 효과를 얻기도 했습니다.

    4) 카스

    카스는 2024 새해 첫 광고 캠페인으로 이른바 ‘축카스’를 진행했습니다. ‘축카스’는 ‘축하’와 ‘카스’가 합쳐진 단어입니다. 특히 이번 광고는 AI를 활용해 소비자가 직접 참여하는 형태로 진행되었는데요. 카스 공식 홈페이지에 들어가서 축하할 사람의 이름과 문구를 적으면 가수 비비가 AI 보이스로 축하 메시지를 읽어줍니다. 파티, 졸업, 이사, 공채 등의 시즈널 이슈 등 4가지 영상 템플릿 가운데 원하는 템플릿을 직접 선택할 수 있습니다. 해당 영상은 다운로드나 공유도 모두 간편하다는 사실!

    4. 취업이 고민된다면? 인공지능에 답이 있다

    앞서 살펴본 것처럼 AI는 다양한 분야에서 활용되고 있습니다. 때문에 사람이 일할 자리가 꾸준히 줄어들고 있지만 아이러니하게도 실제로는 전문 AI 인재를 구하기는 매우 어려운 상황입니다. 한국 대기업들도 AI 시장을 선정하기 위해 인재 채용에 전력을 가하고 있습니다. 예를 들어 삼성전자는 최근 90여 개에 걸친 직무에서 사원을 채용한다고 밝혔습니다. AI 분야 인재 모집에 적극적으로 뛰어든 것이 눈길을 끕니다. 앞서 지난해 6월에는 삼성전자의 생성형 AI ‘삼성 가우스’ 개발 인력을, 12월에는 비스포크 가전에 생성형 AI 적용에 필요한 인력을 채용하기도 했습니다.

    작년 영국의 미디어 분석 미디어가 발표한 글로벌 AI 지수에 따르면 한국은 62개국 가운데 6위를 차지했습니다. 반면 AI 전문 인재 수는 2,500명으로 30개국 중 22위, 전 세계의 0.5%에 불과합니다. 국내 AI 시장의 경쟁력을 강화하기 위해서는 컴퓨터공학 등 관련학과 정원 확대가 절실하다는 목소리가 높습니다. AI로 인한 일자리 상실이 고민된다면, 하루라도 빨리 AI를 활용할 수 있는 인재로 거듭나야 할 시점입니다.

    5. 마치며

    생성형 ai 시대가 도래하면서 AI가 만든 결과물의 완성도 역시 높아지고 있습니다. 바로 지난주였죠. AI 전문 기업 오픈AI(OpenAI)는 바로 지난주 새로운 AI 서비스 소라를 출시했습니다. 소라는 작성자가 프롬프트에 요청한 복잡한 텍스트를 영상으로 구현할 수 있어 업계에 충격을 주고 있습니다. 소라를 활용하면 인물과 배경을 고려해 영상을 연출할 수 있을 뿐만 아니라 감정도 더욱 섬세하게 표현할 수 있습니다. 오로지 프롬프트에 작성한 글 만으로요.

    챗GPT 출시 이후로 급속히 발전하는 AI 기술은 이제 놀라움을 넘어 두려움을 자아냅니다. 그중에서도 광고, 비롯한 시네마틱, 애니메이션에 이르는 모든 영상 시장의 판도를 빠르게 바꾸고 있습니다. AI 시대가 필요로 인재가 되고 싶지만 진입장벽이 높다고 생각하고 계신가요? 인공지능이 아직은 사람을 필요로 하는 만큼, 영상 제작에도 크리에이터의 역량이 중요하게 작용합니다.

    패스트캠퍼스에서는 ai 영상편집을 꿈꾸는 미래 크리에이터들을 위해 ai 기반 영상 제작과 관련한 체계적인 강의를 제공하고 있습니다. ai 영상편집 강의에서는 디즈니, 크래프톤, 라인 등 국내외 대형 기업들과 수많은 프로젝트를 진행한 AI Creative Director가 직접 ai 영상편집에 필요한 노하우를 제공합니다. 강의를 수강하면 누구나 전문 기술 없이도 간편하게 영상을 편집하고 제작할 수 있습니다.

끝없이 이어질 인공지능의 이야기
AI:ing에서 당신의 커리어 성장이 시작됩니다.

ALL

IT

AI:ING only

AI Double UP

AI 자격증(AICA)

이벤트