DeepSeek-R1 모델에 대한 정리
·
📈경제
주말 사이에 큰 뉴스가 나왔다.미국 빅테크가 LLM에 쏟아붇는 돈의 1%만 가지고 LLM의 선두주자인 OpenAI와 견줄만한 LLM 성능을 만들어냈다는 것 중국의 DeepSeek라는 회사의 DeepSeek-R1이라는 모델인데 비용을 크게 줄이면서 좋은 성능을 내는 모델이라고 한다.LLM의 선두주자 OpenAI o1의 모델과 성능을 비교한 것이다.대부분의 추론능력면에서 OpenAI에 뒤지지 않는 결과를 보여줬다. 이 밖에도 영어, 코딩, 수학, 중국어 등 추론능력이 필요한 분야 뿐 아니라 비추론 능력부분까지도 OpenAI의 chat gpt와 비슷한 퍼포먼스를 냈다.Code부분의 Codeforces가 있는데 전 세계 컴공생들 사이에서 유명한 알고리즘 문제풀이 사이트이다.Codeforces 레이팅이 Open..