• C#流行的词云库Sdcb.WordCloud和KnowledgePicker/WordCloud特点比较
  • 发布于 1个月前
  • 87 热度
    0 评论
  • 久就旧
  • 0 粉丝 30 篇博客
  •   
前言
我之前不是用 Avalonia 开发了 StarBlogPublisher(一款为 StarBlog 设计的 Markdown 文章发布工具)吗?当时里面有个分类 词云(Word Cloud) 展示功能。 初版的词云虽然 "能用",但效果极其粗糙——基本只是简单堆叠文字,完全没有体现出词云那种灵动、密集、错落有致的美感。于是,我决定 彻底重构 这一模块,重新寻找合适的词云生成方案。

选型
在 Avalonia 生态中是没有直接可用的词云组件的。不过没事,C# 的生态还算丰富,基本要啥有啥,词云自然不在话下。在调研阶段,我找到了两个比较流行的 C# 词云库:
1.Sdcb.WordCloud
2.KnowledgePicker/WordCloud
简单对比一下:
特性 Sdcb.WordCloud KnowledgePicker.WordCloud
渲染引擎 SkiaSharp(跨平台) SkiaSharp(跨平台)
输出格式 图片(PNG)、SVG、JSON 图片(Bitmap)、SVG(需要自绘)
自定义程度 高(遮罩、字体、多方向、JSON输出等) 中(字体、颜色、布局可定制,但不支持遮罩)
遮罩功能 ✅ 原生支持遮罩图生成特定形状词云 ❌ 暂不支持遮罩,生成规则矩形词云
最近维护状态 活跃(2024年持续更新) 活跃(2024年有提交)
使用复杂度 中(配置多、自由度高) 中(较简洁,适合快速集成)
共同点
1.两者都使用 SkiaSharp,意味着可以在 Windows、Linux、macOS 等多平台运行。

2.都支持灵活配置字体、布局、颜色,并且速度非常快。


主要区别
1.Sdcb.WordCloud 更注重视觉效果(支持复杂遮罩图案),适合追求自定义形状、炫酷效果的场景。
2.KnowledgePicker.WordCloud 更注重性能和简洁性,适合标准矩形词云生成,不追求复杂形状。
最终,我选择了功能更强大、兼容性更好的 Sdcb.WordCloud。

Sdcb.WordCloud简介
Sdcb.WordCloud 是一个基于 SkiaSharp 的跨平台词云生成库,具备以下特点:
1.跨平台兼容:Windows、Linux、macOS 均可使用。
2.多种输出:支持生成图片、SVG文件或JSON数据。
3.高度可定制:自定义字体、颜色、遮罩图案、文本排列方式等。
4.无依赖System.Drawing:在服务器环境也能轻松部署。

5.开源友好:MIT License,开发者自由扩展。


安装
dotnet add package Sdcb.WordCloud
实战:在 StarBlogPublisher 中应用
重构后的词云生成逻辑主要分为两步:
1.获取词频数据
首先,从后端API请求分类词频数据,并进行简单扩充(让词云密度更高)。
private async Task<List<WordScore>?> GetWordScores() {
var response = await ApiService.Instance.Categories.GetWordCloud();
if (response.Data == null) thrownew Exception("获取词云数据失败");

var originalScores = response.Data
    .Select(e => new WordScore(Score: e.Value, Word: e.Name))
    .ToList();
// 堆代码 duidaima.com
var extendedScores = new List<WordScore>();
foreach (var score in originalScores) {
    for (int i = 0; i < 10; i++) {
      extendedScores.Add(score);
    }
  }

return extendedScores;
}
这里小技巧:  将原本每个单词的词频复制多次,可以有效提升词云的视觉密度和丰富度。

2.生成词云图像
拿到词频数据后,使用 WordCloud.Create() 创建词云对象,并通过遮罩图案和字体定制,生成最终的词云图片。
private async Task GenerateWordCloudImage() {
var wordScores = await GetWordScores();
if (wordScores == null || !wordScores.Any()) {
    ErrorMessage = "没有可用的词云数据";
    return;
  }

var wc = WordCloud.Create(new WordCloudOptions(900, 900, wordScores) {
    FontManager = new FontManager([
      SKTypeface.FromFamilyName("Times New Roman")
    ]),
    Mask = MaskOptions.CreateWithForegroundColor(
      SKBitmap.Decode(awaitnew HttpClient().GetByteArrayAsync(
        "https://io.starworks.cc:88/cv-public/2024/alice_mask.png"
      )),
      SKColors.White
    )
  });

usingvar skImage = wc.ToSKBitmap();
usingvar data = skImage.Encode(SKEncodedImageFormat.Png, 100);
usingvar stream = new MemoryStream(data.ToArray());
  WordCloudImage = new Bitmap(stream);
}
这里用了两点增强体验的小技巧:
遮罩图:使用一张指定形状的透明图,词云可以呈现人物轮廓、LOGO形状等,极大提升美感。

自定义字体:更换字体可以让整体风格更符合网站/应用的设计感。


效果展示
话说之前的效果能算词云吗??

小结
通过这次重构,我总结出几点经验:
1.选对库很重要,跨平台、高扩展性是首要考虑。
2.词云美观与否,关键在于密度、遮罩形状、字体风格的搭配。
3.尽可能异步请求和局部优化,避免UI卡顿。
如果你也在C#项目中需要集成词云功能,推荐试试Sdcb.WordCloud —— 简单高效,而且效果不错!
用户评论