본문 바로가기

반응형

생성형 AI

(8)
생성형 AI Top 100(feat. a16z) 지난 8월말, *a16z 는 생성형 AI Top 100을 발표했습니다.(웹사이트 50개, 앱 50개로 중복되는 서비스가 있음) 생성형 AI가 새롭게 나왔다는 발표를 보던게 엊그제 같은데, 발표된 AI가 100개가 넘어 Top100을 선정한다니 놀랍습니다. a16z 가 선정한 목록을 보며, 어떤 AI 들이 선정되었는지 눈여겨 볼만한 AI는 어떤것이 있는지 살펴보고자 합니다. * a16z : 앤드리슨 호로위츠(앤드리슨 호로위츠) 를 뜻하는 말로, 주로 기술 스타트업에 투자하는 실리콘밸리의 벤처 캐피털 회사 아래는 a16z 홈페이지의 사진입니다.  아래표는 위 내용을 토대로 각 AI 의 기능과 입출력값을 간단히 표기한 내용이다. AI 명기능입력출력 AI Novelist      소설 아이디어나 전체 소설 생성..
Stable-Diffusion(Comfyui) 로 생산성 높이기: 초보자를 위한 이미지 생성 프롬프트 엔지니어링 가이드(논문을 중심으로_1) 대상 논문 : "A Taxonomy of Prompt Modifiers for Text-To-Image Generation(Jonas Oppenlaender)" 결론 : Modifier 를 이용하여 텍스트 to 이미지 를 생성해 보았다(스테이블 디퓨전). 유의미한 결과들을 얻을 수 있었다.Modifier : 설명Subject term : 주제를 나타냅니다.Style modifier : 예술적 스타일을 나타냅니다.Image prompt : 이미지를 통해 스타일 또는 주제를 나타냅니다.Quality booster : 이미지의 품질을 향상시키기 위한 용어입니다.Repeating term : 이 주제 또는 스타일을 강화하려는 의도로 주제 용어 또는 스타일 용어를 반복합니다.또는 스타일Magic term : 의외..
GPT-4o: OpenAI의 새로운 모델과 그 특징 GPT-4o가 발표됐습니다.새로운 GPT의 특징은 다음과 같습니다.공식 홈페이지 : https://openai.com/index/hello-gpt-4o/ 결론 : 윈도우 사용자는 당장 사용 불가하며, 윈도우 무료 사용자도 하반기엔 사용가능! - GPT-4o 의 "o"의 의미 : omni(모든, 전체)- 보다 자연스러운 상호작용- 텍스트, 오디오, 이미지를 입력하고 텍스트, 오디오, 이미지를 출력 함- 기존 모델에 비해 시각과 오디오 이해가 뛰어남- 음성대답에 대해 평균 320ms(2.8초(GPT-3.5)와 5.4초(GPT-4)) 만에 대답 함- 비영어 텍스트에 대해 토큰 효율이 향상 됨(한국어의 기준 1.7배 향상 됨)- API 사용가격은 50% 낮아짐 - 모든 입력과 출력에 대해 하나의 신경망으로 텍스..
Genie AI로 3D 이미지를 생성하는 방법(3D 프린터 포맷 지원) 이 포스팅에서는 Genie AI를 사용하여 독특하고 매력적인 이미지를 만드는 과정을 안내합니다.  후기)1. Genie AI 는 무료로 3D 이미지를 생성 할 수 있습니다.2. 3D 이미지는 영상등 창작물에 사용하기엔 퀄리티가 좋지않습니다.3. 다만, 3D 프린팅에 사용할 수 있는 이미지출력기능을 제공하여,    실제 3D 프린팅을 사용하기위해서는 아주 좋은 선택지가 될 수 있을 것 같습니다.    지원 포맷 : fbx, gltf, usdz, blend, stl, obj "포켓몬 피카츄" 입력시 피카츄를 출력해준 결과. 3D 프린터로 출력하기 좋아보인다.  아래는 Genie AI를 사용하기 위한 가입 및 사용 과정이다.1. 가입하기: https://lumalabs.ai/ . Genie AI는 현재 무료로..
ComfyUI(스테이블 디퓨전(Stable Diffusion))을 사용하여 이미지의 특정 부분만 수정하는 방법: 인페인팅(inpainting) 이미지 전체를 바꾸는 대신 특정 부분만 섬세하게 수정하고 싶으신가요? 이번 포스트에서는 ComfyUI로 이미지의 특정 부분을 수정하는 인페인팅 기능에 대해 알아보겠습니다. 지난번 고래사진을 그리면서 하늘을 표현했으면 좋겠다는 생각이 들어 인페이팅에 대해 공부를 해보았습니다.인페이팅은 특정 그림의 부분을 새로 만드는 것으로, 아래와같이 그림을 붙인듯한 느낌이 많이 들었습니다.자연스럽게 나올수 있는 방법은 공부가 더 필요할 것으로 보입니다.  : 인페이팅은 기존 그림의 내용을 어느정도 포함하며(이전 사진과의 조화) 내가 추가하고 싶은 내용을 뚜렷하게 써야함을 알았다. 인페이팅 기능을 사용하기 위해선1. 인페이팅 워크플로우 설정(필수)2. 인페이팅 모델(체크포인트) 다운(선택)3. 마스크 영역수정 및 이미지생..
스테이블 디퓨전(Stable Diffusion)을 이용하여 원하는 이미지를 생성하는 방법(feat. 딥엘(DeepL) 및 제미나이(Gemini)) 스테이블 디퓨전을 이용해서  사용한 AI는 아래와 같다.1. 딥엘(DeepL) : 한글 → 영어 번역2. 제미나이 : 스테이블 디퓨전을 위한 프롬프트 생성 요청3. 스테이블 디퓨전 : 이미지 생성 및 속성 수정4. 원하는 결과가 나올때 까지 1~3 반복 아래는 위 순서대로 이미지를 만드는 과정이다.1. 딥엘 (DeepL) 을 이용해 영어로 제미나이에 쓸 프롬프트를 요청한다. 2.  제미나이를 이용해  스테이블 디퓨전을 위한 프롬프트를 요청한다.3. 스테이블 디퓨전 : 이미지 생성 및 속성 수정 구름위를 날아다니는 고래를 만들고 싶었는데, 생성이 되지 않아 속성을 조절해본다.프롬프트를 제대로 따르지 않았다 판단하여 "프롬프트를 얼마나 충실히 따르는지"를 조절하는 cfg를 높여본다.    cfg가 무조건 높..
이미지 생성 AI 스테이블 디퓨전 설치방법 : ComfyUI 를 통한 Stable diffusion(스테이블 디퓨전) 사용 지난글에서 "스테이블 비디오" 를 통해 영상을 만들어 보았습니다. 1. 이미지 생성 AI 설치 계기 : AI 이미지를 이용한 AI 비디오 만들기 프롬프트만을 이용해 만들어 봤는데, 이미지를 이용해 영상을 만들어보고 싶다는 생각이 들었습니다. 이에 이미지 생성 AI 스테이블 디퓨전을 설치하고 사용해보기로 하였습니다. 스테이블 디퓨전은 무료로 사용 가능한 오픈소스 이미지 생성 AI 모델 입니다. -> 프롬프트를 통해 이미지를 생성하는 모델. 대표 기능) 1) 텍스트-이미지 생성: 간단한 텍스트(프롬프트)를 통해 이미지를 생성. 2) 이미지 수정 : 기존 이미지를 새 프롬프트에 따라 수정. 3) 인페인팅 : 이미지의 특정 부분을 새로 생성한 콘텐츠로 변경. 3) 아웃페인팅 : 기존 이미지를 원래 가장자리 너머..
AI 영상 제작 시대 열리다! : 스테이블 비디오 오픈 베타 사용후기 AI 영상 제작 도구 경쟁 심화: 스테이블 비디오 오픈 베타 공개 Stability AI 사에서 스테이블 비디오의 오픈 베타 버전을 공개했습니다. OPEN AI의 SORA가 아직 일반인에게 공개되지 않아 아쉬운 차에 바로 사용해 보았습니다. 텍스트와 이미지 생성에 이어 영상까지 AI로 제작할 수 있다는 점에서 스테이블 비디오의 등장은 AI 영상 제작 도구의 경쟁을 심화시킬 것으로 예상됩니다. 사용 후기 긍정적인 면 텍스트 프롬프트를 기반으로 원하는 영상을 간단하게 제작할 수 있었습니다. 이미지를 통해서도 간단하게 영상을 제작할 수 있었습니다. 비교적 빠른 속도로 영상을 생성할 수 있었습니다. 유체의 움직임에 강점이 있는것으로 보입니다. 아쉬운점 영상 품질이 아쉬웠습니다. Step 을 조정할수 있으나 기본..

반응형