전체 글 (7) 썸네일형 리스트형 임베딩 기반 Unsupervised 키워드 추출 모델 정리 및 local-context 한계에 관한 논의(EmbedRank, AttentionRank, JointGL) 안녕하세요! 현재 Unsupervised 키워드 추출에 관해 연구 진행을 하고 있어 키워드 추출에 관심 있는 분들과 이야기를 나누고 싶어 글을 쓰게 되었습니다. 오늘 다룰 내용은 임베딩 기반 키워드 추출의 대표적 모델인 EmbedRank와 EmbedRank의 local-context에 관한 한계를 보완하기 위해 나온? AttentionRank, JointGL 모델들에 대해 간략히 정리하려 합니다. 그 후 실제로 이 두 모델이 효과적으로 local-context를 고려했는지에 관해 제 개인적인 생각을 공유하려 합니다. 아직 지식 등 여러모로 부족하므로 여러분들과 공유하여 논의하고 싶어 작성하게 되었고, 댓글을 통해 의견을 자유롭게 적어주시면 감사하겠습니다! EmbedRank연구 목적: domain-spec.. [논문 리뷰] Neural Graph Collaborative Filtering 안녕하세요 여러분. 오늘은 graph 구조를 이용한 추천시스템 연구를 제안한 논문에 대해서 살펴보독록 하겠습니다. 논문잘못된 부분이나 이해가 안가는 부분이 있다면 댓글남겨주시면 감사하겠습니다.ABSTRACT추천시스템은 유저와 아이템의 vector representation(일명 embeddings)을 학습하는 것이 연구의 주였습니다. 초기의 matrix factorization에서 부터 최근의 딥러닝 방식들은 유저나 아이템의 임베딩 벡터를 구할 뿐 유저와 아이템의 상호작용(user-item interaction)에 잠재되어있는 collaborative signal은 학습 과정에서 인코딩되지 않는다고 저자들은 주장합니다. 그래서 저자들은 유저와 아이템의 구조를 잘 나타낼 수 있는 graph 구조를 이용한 .. 24년도 제 52회 SQLD 시험 후기 및 공부법 안녕하세요 여러분! 어제인 3월 9일 sql 시험일이었지요. 전 sql 개발자인 sqld 시험을 응시하였는데요, 시험에 관하여 짧게 후기를 남기려고 합니다! 처음 시험을 보는 거라 시험의 난이도가 어떤지 정확히 말씀드리진 못하겠지만, 제가 느끼기엔 그리 어렵진 않았습니다. 당연히 모르는 문제들도 있었지만 60점을 넘기기에는 쉬운 난이도 였다고 말씀드리고 싶네요. 전 아래에서 소개해 드릴 유튜브 강의를 듣고 문제를 풀기 시작하였는데요, 문제집은 데이터진흥원 공식 문제집인 노랭이를 풀었습니다! 꼭 개정된 노랭이를 사서 풀기를 권장해 드리고 싶습니다. 이유는 이 책에서 문제가 4문제 정도 나와 쉽게 문제를 풀 수가 있었기 때문입니다. 선지도 똑같게 나와 바로 정답을 찍고 다음 문제로 넘어갈 수 있었습니다. 이.. [논문 리뷰] Bootstrapping User and Item Representations for One-Class Collaborative Filtering 논문ABSTRACTone-class collaborative filtering (OCCF)은 유저가 (홈페이지 방문, 앱 설치함) 와 같은 positive user-item interaction이 적게 관측 된 데이터를 이용하여 positive하게 관련된 user-item pair (앞으로 간단하게 pair로 쓰겠습니다) 을 식별하는 것을 목표로 하고 있습니다. 기존 OCCF 연구들은 관측되지 않은 pair를 negative로 고려한 채 모델링을 하였습니다. 예를 들어 유저가 어떤 상품(item)을 클릭한 경우 관심이 가는 상품으로 보고 positive 하다고 할 수 있고, 클릭하지 않은 경우 관심이 없는 상품이라 생각하여 negative로 고려한 것입니다. 하지만 사실은 유저가 관심이 있는 상품이지만 .. [논문 리뷰] Wide & Deep Learning for Recommender Systems 논문 이 논문은 2016년에 구글이 발표한 논문으로 memorization에 능한 wide model과 generalization에 능한 deep model을 결합한 추천 시스템 모델을 제안한 논문입니다. Google play에서 실험을 수행하였고, 기존 wide 또는 deep model 만을 이용한 것보다 성능이 우수함을 보였습니다. ABSTRACT cross-product feature transformation을 이용한 선형모델은 feature간 상호작용(interactions)의 기억(memorization)에 효과적입니다. (feature interaction은 다음 글을 참고해 주세요(https://tootouch.github.io/IML/feature_interaction/) ) ( 자세한 .. [논문 리뷰] Representation Learning with Contrastive Predictive Coding 논문 안녕하세요. 처음으로 논문 리뷰 글을 작성하게 되었습니다. 이번에 소개해 드릴 논문은 "Representation Learning with Contrastive Predictive Coding" 논문입니다. Contrastive Predictive Coding(CPC)은 unlabeled data로부터 유용한 representation을 학습할 수 있고, 여러 domain에 적용할 수 있다는 장점이 있습니다. 처음 작성하는 리뷰이기 때문에 아직 부족한 부분이 많을 것이라고 생각합니다. 혹시 잘못된 점이나 질문이 있다면 댓글 남겨주시면 감사하겠습니다!Abstract 논문에서 Contrastive Predictive Coding, 즉 high-dimensional data로부터 유용한 represen.. 안녕하세요 안녕하세요. 현재 대학교에 재학 중이며 학부 연구생을 하고 있는 학생입니다. 저는 데이터 분석, 인공지능, 추천 시스템(recommender system) 분야에 관심이 있어 공부를 하고 있습니다. 학부 연구생을 하면서 혼자서 공부하는 것보단 여러 사람들과 의견을 공유하며 배우는 것이 중요하다고 느꼈고, 남들에게 배운 내용을 발표해 보니 알고 있다고 생각했지만 생각보다 모르는 내용들이 많다는 것을 느꼈습니다. 또한 공부한 내용을 정리할 필요가 있다고 느꼈고, 모든 내용을 정리하기엔 한계가 있어 중요하다고 느끼는 내용들을 블로그에 올리려고 합니다.앞으로 차근차근 블로그를 작성해 나가려고 합니다. 제 블로그에 방문하여 글을 읽어주시는 모든 분들께 감사드립니다. 블로그 글에 궁금한 점이나 잘못된 내용이 있다면.. 이전 1 다음