背景

在日常开发中,我们难免会遇到需要将汉字转化成拼音的场景,最开始我在网上搜到了利用Pinyin4j 实现汉字转拼音,但是对于多音字问题采取的是组合拼音方式,例如长沙 取拼音结果就是 changsha zhangsha。 Pinyin4j对于多音字的处理就是自己写一个多音字的txt文档,将多音字该发的读音放入,但这难免有些麻烦,于是我便有找到了一种方法,可以更简单的实现该功能

实现

我们可以使用具有语义的依赖包(例如hanlp,底层也是用的自定义字典实现),该依赖包内置了许多常见的多音字以及该发的读音(但对于人名的多音字还是不能做到很好的处理)

导入依赖

<!--        汉字转拼音-->
        <dependency>
            <groupId>com.hankcs</groupId>
            <artifactId>hanlp</artifactId>
            <version>portable-1.8.3</version>
        </dependency>

编写工具类

public class PinyinUtil {

    /**
     * 获取中文完整拼音
     *
     * @param chineseStr
     * @return
     */
    public static String getPinyin(String chineseStr) {
        List<Pinyin> pinyins = PinyinDictionary.convertToPinyin(chineseStr);
        StringBuilder stringBuilder = new StringBuilder();
        for (Pinyin pinyin : pinyins) {
            stringBuilder.append(pinyin.getPinyinWithoutTone());
        }
        return stringBuilder.toString();
    }


    /**
     * 获取中文拼音首字母
     *
     * @param chineseStr
     * @return
     */
    public static String getInitial(String chineseStr) {
        List<Pinyin> pinyins = PinyinDictionary.convertToPinyin(chineseStr);
        if (CollectionUtils.isEmpty(pinyins)) {
            return StringUtils.EMPTY;
        }
        return String.valueOf(pinyins.get(0).getPinyinWithoutTone().charAt(0));
    }
}

测试

 @Test
    void contextLoads18() {
        System.out.println("郑州的拼音转化:"+ PinyinUtil.getPinyin("郑州"));
        System.out.println("长沙的拼音转化:"+ PinyinUtil.getPinyin("长沙"));
        System.out.println("年长的拼音转化:"+ PinyinUtil.getPinyin("年长"));
    }

Snipaste_2024-05-09_15-18-28.png

ok,完美解决!