介绍
最近,我一直在对几个法学硕士进行特定领域的微调。这项任务的第一个也是最重要的部分是收集、抓取和清理文本数据以供法学硕士学习。我注意到我的代码因多次重复而变得混乱,因为对于每个已识别的源,我都从头开始编写一个脚本,该脚本与我的代码库中的其他脚本有很多共同点。我没有遵循 –不要重复自己‐ (DRY) 原则根本没有。这就是为什么我决定实现模板设计模式并使我的代码库更加优雅和高效。
模板设计模式
我不会在这里重复什么是设计模式以及我们如何根据功能对设计模式进行分类,因为我已经写了很多关于该主题的文章。如果您有兴趣阅读我之前关于该主题的文章,我将在最后留下一些参考资料。
在这篇文章中,我将向您展示与数据处理相关的示例。假设在我们的项目中,我们必须处理要分析的不同类型的数据。其中一些数据是……