SkillAgentSearch skills...

FinancialDatasets

SmoothNLP 金融文本数据集(公开) Public Financial Datasets for NLP Researches Only

Install / Use

/learn @smoothnlp/FinancialDatasets
About this skill

Quality Score

0/100

Supported Platforms

Universal

README

FinancialDatasets

SmoothNLP 金融文本数据集(公开) | Public Financial Datasets for NLP Researches

API接口服务

数据一览

由于github存储有限, 如需全量数据集, 请联系: contact@smoothnlp.com

| 数据名称 | 数据字段 | 样本量 | 总量 | 下载链接 | | ----- | ------ | ----- | ----- | ----- | | 企业工商信息 | 名称,公司名称,公司介绍,工商,地址,工商注册id,成立时间,法人代表,注册资金,统一信用代码,网址 | 1万 | 50万 - (上市及中小型企业) |下载 | | 金融讯息新闻 | title-新闻标题,content-新闻内容,pub_ts-发稿日期 | 2万 | 210万 | 下载 | | 专栏资讯 | title-新闻标题,content-新闻内容,pub_ts-发稿日期 | 1万 | 58万 | 下载 | | 投资机构信息 | 机构名称,介绍,行业,规模,轮次| 1K | 3万 | 下载 | | 投资事件 | 事件资讯,投资方,融资方,融资事件,轮次,金额 | 2K | 7万 | 下载 | |36氪新闻| title-新闻标题,content-新闻内容,url-网址 |1万|11万|下载

推荐研究方向

  • Embedding (Word2Vec, Bert, 等)
  • 实体识别 - NER
  • 无监督聚类: 基于企业描述信息, 进行竞品聚类
  • 企业行业分类
  • 标题总结 - Text Summary
  • 序列分类 - Sequence Classification

数据展示

投资机构

机构

投资事件

投资事件

企业工商信息

工商

金融资讯新闻

新闻

专栏资讯

专栏

36氪新闻

36氪

Related Skills

View on GitHub
GitHub Stars500
CategoryEducation
Updated4d ago
Forks115

Security Score

80/100

Audited on Apr 3, 2026

No findings