Open AI Deep research - 이길 수 없다면 합류해라

아무거나 씁니다 2025. 2. 8. 18:28

0. 잡소리

딥시크 관련 이슈가 나온 이후로 AI 관련 글을 조금씩 올리기 시작했는데,

하루도 빠짐 없이 새로운 기술이 출시 되어 당황스럽다.

학부 시절 비전공자를 위한 AI 수업을 들어 원리에 대해 조금 아는 수준인데,

요즘 드는 생각은 원리보다는 만들어진 것에 대한 사용 방법을 배우는 것이 조금 더 괜찮지 않았을까 싶다.

프롬프트 엔지니어링이라던가..

나만의 소스를 만드는 것도 좋지만, 석박사가 만든 맛있는 소스를 가져다가 음식을 내는 게 좀 더 맛있는 거니까..

2월 3일 Open AI에서 Deep research가 발표 되었다.

HLE라는 AI의 성능을 측정하는 벤치마크에서 출시 초기에는 딥시크 R1이 9.4%로 1위였지만,

ChatGPT o3-mini는 10.5%, o3-mini-high는 13%였으며, "딥 리서치는 정확도가 26.6%"로 1위를 차지했다.

물론 R1과 다르게 딥 리서치는 웹 서치가 가능해서 오픈 북이긴 했지만.. o3이 역전한 것 자체로도 의미가 크다.

OpenAI Deep Research 가 작성한 엔비디아 투자 보고서

OpenAI Deep Research 에게 엔비디아에 대한 리서치를 해달라고 했습니다. Deep Research 의 파괴력...

blog.naver.com

보고서 위쪽 내용을 한번 읽어봤으면 좋겠는데, 상대적으로 가벼운 모델로 13분 만에 리서치를 뽑아냈다는 무서운 글이다.

저 기능은 현재 월 200$ Pro 요금제만 이용할 수 있으나, 시간이 지남에 따라 점차 하위 요금제도 허용할 예정이다.

2월 5일 구글 Gemini 또한 3가지 모델을 추가했다.

2.0 Flash Thinking Experimental

2.0 Flash Thinking Experimental with apps

2.0 Pro Experimental

개발도 아니고 프롬프트에서 사용하는 모델 이름이 이러면 뭐가 뭔지 어떻게 아냐..

점유율이 높은 크롬이나 안드로이드, Gmail, 유튜브, 구글맵과 연동할 수 있는 플랫폼을 가지고 있으면서

인지도가 없는 게 이 때문이 아닐까?

아무튼

벤치 마킹에서는 좋은 성적을 거두지는 못했으나, 구글에서 제공하는 서비스와 연동해서 사용할 수 있으며,
Pro 모델은 Gemini Advanced에 가입하면 사용할 수 있다. 다른 모델은 Gemini에서 바로 사용 가능하다.

번외로 위 사진을 보면 AI스튜디오를 사용하면 무료로 Pro 모델을 사용할 수 있는 듯 하다.

예를들어

40분 전에 올라온 게임 경기에 대한 내용을 정리하거나,

길을 물어보면 구글 맵을 사용해서 알려준다.

이런 것도 가능해진다.

슬슬 AI에 대한 상용화가 이루어 지면서 다양한 서비스가 나오고 있고

더 똑똑해지거나 더 다양한 기능을 가지고 있는 등 각 서비스의 특성에 맞게 발전할 것이다.

1년 전 과제하면서 멍청한 AI랑 싸웠었는데,, 이젠 나보다 똑똑한 친구가 된 걸 보니 기분이 묘하기도 하고, 무섭다.

AI로 인해 추워진 취업 시장에서 설국 열차마냥 빙하기가 올 것인지 모두가 행복한 대유쾌 마운틴이 올 지는 모르겠다.

확실한 건