Zero에서 시작하는 썬's 인공지능 공부방
close
프로필 배경
프로필 로고

Zero에서 시작하는 썬's 인공지능 공부방

  • 분류 전체보기 (76)
    • 리눅스 (Linux) (0)
    • AI (인공지능) Paper Review (12)
      • Gen AI (Large Model) (7)
      • NLP (3)
      • Audio (2)
      • Vision (0)
      • 경량화 (0)
    • LLM (13)
      • LangChain (9)
      • LangGraph (Agents) (0)
      • PlayGround (4)
    • 알고리즘과 자료구조 (17)
      • 매일매일 알고리즘 (15)
      • 이론? (2)
    • 기타 등등 (8)
      • Git (2)
      • Python Framework (2)
      • DevOps (2)
      • DB 설계 (0)
      • 시행착오 (0)
    • 딥러닝 기초 (15)
      • Python (5)
      • Pytorch | JAX | Tesnorflow (0)
      • 수학.. (4)
      • 머신러닝 & 딥러닝 (4)
      • Reinforcement Learning (2)
    • 후기 및 회고💦 (7)
    • 도서 리뷰 (4)
  • 홈
  • 태그
  • 방명록
[MCP Tutorial] 01. MCP란?

[MCP Tutorial] 01. MCP란?

* 본 포스팅은 Microsoft의 mcp for beginners 레포지토리를 참고하여 작성되었습니다. 더보기https://github.com/microsoft/mcp-for-beginners GitHub - microsoft/mcp-for-beginners: This open-source curriculum is designed to teach the concepts and fundamentals of the ModeThis open-source curriculum is designed to teach the concepts and fundamentals of the Model Context Protocol (MCP), with practical examples in .NET, Java, TypeSc..

  • format_list_bulleted LLM/PlayGround
  • · 2025. 7. 14.
  • textsms
[From tokens to thoughts] How LLMs and Humans Trade Compression for Meaning 논문 리뷰

[From tokens to thoughts] How LLMs and Humans Trade Compression for Meaning 논문 리뷰

안녕하세요, 이번에 리뷰해 본 논문은 25년 5월 발표된 From tokens to thoughts 라는 논문입니다.🤗 최근 Embedding 논문들에 관심을 가지면서 몇 가지 Embedding 관련 논문들을 읽어보았는데요, 모델이 표현하는 토큰/ 단어/ 문장의 의미와 인간이 표현하는 개념들에 대해서 어떤 차이가 있는지, 만약 차이가 존재한다면 우리가 앞으로 어떤식으로 모델들을 개발시켜야 하는지 그런 방향성에 대해서 고민해보는 논문입니다. 해당 개념을 표현하기 위해 인지과학적인 내용들도 좀 등장하는데요,이런 식으로도 생각해 볼 수 있구나 정도로 편하게 읽어내려가 보았습니다. 원문은 아래 링크에서 확인하실 수 있습니다.https://arxiv.org/abs/2505.17117 From Tokens to ..

  • format_list_bulleted AI (인공지능) Paper Review/NLP
  • · 2025. 7. 6.
  • textsms

Google Prompt Engineering White Paper

Original Paper Link : https://www.kaggle.com/whitepaper-prompt-engineering?_bhlid=a2bfce2cac67662098bd85a241e7cb000576e5d4 Prompt Engineering www.kaggle.com Google에서 정리한 Prompt Engineering White Paper에 대해 간단히 요약하여 정리해 보았습니다🙌읽고 느낀 점은.. LLM & Prompting은 아직은 여전히 경험적으로 체득해야 하는 부분이 훨씬 더 많은 것 같네요😇Prompt EngineeringLLM takes sequential text as input then predict the following token should bethe next ..

  • format_list_bulleted AI (인공지능) Paper Review/Gen AI (Large Model)
  • · 2025. 5. 26.
  • textsms

[가짜연구소 On-Device #1] Structured Pruning & Unstructured Pruning

Pruning vs Dropout?추론 중에 Dropout은 가중치가 복원되지만, Pruning은 복원되지 않음. Unstructured PruningNetwork Optimization Technique 중 하나 (크기나 중요성에 따라 각각의 가중치를 제거하는 기술)네트워크에서 낮은 크기의 가중치를 0으로 설정하는 것으로 일부 연결을 끄고 그 효과를 무시하는 것과 같음개별 가중치 요소들을 선택적으로 0으로 설정 (제거)하여 sparse 매트릭스(행렬)을 만드는 방식모델의 전반적인 아키텍처 (레이어 크기)는 바뀌지 않고, 단지 가중치 행렬 내에 0이 많이 삽입되어 희소 행렬(sparse matrcis)로 변할 뿐입력과 가중치 행렬의 출력 모양을 변경하는 결과를 낳음전체 뉴런이나 필터의 구성을 제거하는 s..

  • format_list_bulleted 후기 및 회고💦
  • · 2025. 3. 21.
  • textsms
[Lost in the Middle] How Language Models Use Long Contexts 논문 리뷰

[Lost in the Middle] How Language Models Use Long Contexts 논문 리뷰

RAG가 한창 유행일 당시 (지금도 여전히...)Long Context 사이즈의 모델의 필요성이 대두되었고, 모델이 새로 개발됨에 따라 긴 길이의 Context를 수용할 수 있는 모델들이 등장하곤 했습니다. 위 논문은 긴 Context가 들어왔을 때 모델이 문맥의 앞, 뒤는 이해를 하지만 중간 내용은 소실할 수 있는 부분에 대해 다룬 논문입니다. 원문은 아래 링크에서 확인하실 수 있으며, 리뷰 내용에 잘못된 부분이나 오탈자가 있다면 언제든 댓글 달아주시길 바랍니다!🙌https://arxiv.org/abs/2307.03172 Lost in the Middle: How Language Models Use Long ContextsWhile recent language models have the abilit..

  • format_list_bulleted AI (인공지능) Paper Review/Gen AI (Large Model)
  • · 2025. 3. 21.
  • textsms
[가짜연구소] 10기 러너 시작! 🔥

[가짜연구소] 10기 러너 시작! 🔥

여느날과 다름없이 링크드인을 탐색하던 중..가짜연구소에서 여러가지 프로젝트들을 진행할 예정이라는 것을 보고Agent를 비롯한 다양한 주제들을 선보이길래 후다닥 지원해보았다. 무려 300명이 넘는 인원이 지원했다고 했는데 한 2/3 정도의 인원이 함께 진행하시는 것 같다..! 회사 업무를 진행하면서 혼자 공부하기 특히 어려웠던 분야라고 생각되는 온디바이스 분야에 대한스터디를 진행하는 주제가 있어 해당 내용으로 참여해보았다.결국 AI를 하드웨어까지 진행하게 되면 온디바이스는 곧 필수불가결하지 않을까.. 싶다. 사실 또 온디바이스는도메인과 상관없이 최최최최종엔 다 적용되어 있지 않을까..?! https://github.com/Pseudo-Lab/On-Device-AI_On-The-AIr GitHub - Pse..

  • format_list_bulleted 후기 및 회고💦
  • · 2025. 3. 7.
  • textsms
  • navigate_before
  • 1
  • 2
  • 3
  • 4
  • ···
  • 13
  • navigate_next
공지사항
전체 카테고리
  • 분류 전체보기 (76)
    • 리눅스 (Linux) (0)
    • AI (인공지능) Paper Review (12)
      • Gen AI (Large Model) (7)
      • NLP (3)
      • Audio (2)
      • Vision (0)
      • 경량화 (0)
    • LLM (13)
      • LangChain (9)
      • LangGraph (Agents) (0)
      • PlayGround (4)
    • 알고리즘과 자료구조 (17)
      • 매일매일 알고리즘 (15)
      • 이론? (2)
    • 기타 등등 (8)
      • Git (2)
      • Python Framework (2)
      • DevOps (2)
      • DB 설계 (0)
      • 시행착오 (0)
    • 딥러닝 기초 (15)
      • Python (5)
      • Pytorch | JAX | Tesnorflow (0)
      • 수학.. (4)
      • 머신러닝 & 딥러닝 (4)
      • Reinforcement Learning (2)
    • 후기 및 회고💦 (7)
    • 도서 리뷰 (4)
최근 글
인기 글
최근 댓글
태그
  • #nlp
  • #랭체인
  • #PYTHON
  • #Deeplearning.AI
  • #Rag
  • #LLM
  • #LangChain
  • #논문리뷰
  • #백준
  • #prompt
전체 방문자
오늘
어제
전체
Copyright © 썬 All rights reserved.
Designed by "쭈미로운 생활"

티스토리툴바