Recommend

뉴스 제공 업체를 위한 머신러닝 기반 추천 시스템

텍스트 분석 한 개 이상의 피드를 선택해 주세요.(많으면 많을수록 더 좋습니다.)
모델
English multi-task CNN (convolutional neural network) trained on OntoNotes.
spaCy 개체 유형

이 프로토타입은 관련 뉴스 콘텐츠를 자동으로 제안합니다. 프로토타입은 하나 이상의 뉴스 피드를 가져온 다음 Universal Feed Parser를 사용하여 분석되고 pandas 데이터 프레임으로 변환됩니다. 그 다음, 무작위로 선택된 뉴스 기사에서 헤드 라인을 추출하고 spaCy라는 자연어 처리 라이브러리와 en-core-sm 영어 모델을 사용하여 NER (Named Entity Recognition: 명명된 엔티티 인식)을 수행합니다. NER은 지정된 텍스트에서 사람, 장소 및 조직과 같은 명명 된 엔티티를 식별하는 작업입니다. 마지막으로 sci-kit learn 이라는 기계 학습 라이브러리의 CountVectorizer 체계와 cosine_similarity 메소드를 사용하여 문서 용어 매트릭스를 만들고, 유사한 헤드라인을 식별합니다.