精选分类

文章列表

# SpringCloud # 从单体到集群再到分布式 早期阶段,单体架构是主流选择,所有功能模块打包在一个应用中,开发简单直接,但是随着业务增长,代码变得臃肿,难以扩展特定功能模块,技术栈单一,难以采用新技术。 为了应对单体架构的性能瓶颈和高可用需求,集群架构应运而生。 实现方式: 水平扩展:部署多个相同的单体应用实例 通过负载均衡器 (Nginx、F5 等) 分配请求 共享数据库或数据库主从复制 但是仍然有缺陷,比如应用本身仍然是单体,业务复杂时扩展不灵活。 此时分布式架构与微服务应运而生,分布式架构通过将系统拆分为多个服务来解决上述问题。 本次学习使用尚硅谷 b...

# Attention is all you need 【Original Link】 Attention Is All You Need Updated on Aug 2023 Authors Ashish Vaswani Google Brain avaswani@google.com Noam Shazeer Google Brain noam@google.com Niki Parmar Google Research nikip@google.com Jakob Uszkoreit Google Research usz@google.com Llion Jones Google...

# 3DCNN 视频行为检测平台笔记 学习内容基于:https://www.bilibili.com/video/BV1kc411Q7Tj # 图像的本质 图像是由 RGB 三通道组成的,一般数值范围是 0 到 255. 因此像素矩阵为:H * W * 3,其中 H 为高,W 是宽。 # 从图像到视频 视频本质上是由连续的图片(视频帧),快速播放构成的。 图片的像素矩阵是 H * W * 3 视频就是 D * H * W * 3,其中 D 是深度,是视频帧的叠加。 不同的库对与这 4 个维度顺序表述不同,但这四个维度诚然如此。 # 2D 检测方法对比 # C3D...

# 从公式角度看深度学习 学习基于尚硅谷:https://www.bilibili.com/video/BV1MRJmzSEaa # 损失函数 # 均方误差 MSE / L2 Loss(回归问题较适用) Mean Squared Error(MSE) L=1n∑i=1n(yi−ti)2\begin {array}{c} L=\frac{1}{n} \sum_{i=1}^{n}(y_{i}-t_{i})^{2} \end{array} L=n1​∑i=1n​(yi​−ti​)2​ 这个 ti 是目标标签 (向量),yi 是预测标签 (向量),n...

# NLP 自然语言处理 # 常见任务 文本分类:情感分析(积极 / 消极)、垃圾邮件识别、新闻主题分类【句子级别】 序列标注:命名实体识别(找人名、地名、手机号)、文本生成、信息抽取、文本转化【Token 级别】 # 文本表示 # 分词 词级分词:将文本按照词切分在英语中空格往往是天然的切词标志,但是容易出现 OOV 问题(未登录词问题) 字符级分词:一个字母、数字、标点甚至空格,都会被视作一个独立的 token,不会有 OOV 问题,但模型必须依赖更长的上下文来推断词义和结构,这显著增加了建模难度和训练成本。 子词级分词:将词语切分为更小的单元 ——...

# 卷积神经网络 学习内容基于:Pytorch 框架与经典卷积神经网络与实战 # CNN 卷积神经网络算法原理 # 全连接神经网络 输入层是我们输入的数据,这里看到的第一列节点并不是输入层,中间为隐藏层。 输入层就像 X(自变量),模型或者说这些网络就是 F(函数),我们得到的输出就是 Y(因变量)。 # 为什么要使用激活函数 在神经网络中使用激活函数的根本原因是引入非线性,从而使模型能够拟合和表达复杂的函数关系。如果没有激活函数,神经网络无论堆叠多少层,本质上都是一个线性模型,能力极其有限。多层线性变换的叠加依然是线性变换,最终的模型只能拟合直线 / 平面,完全无法处理复杂的数据模式 #...

# RPC 协议远程调用的几种实现 # Dubbo 简介 Dubbo 是阿里巴巴公司开源的一个高性能、轻量级的 Java RPC 框架。 致力于高性能透明化的透明化的 RPC 原创服务调用方案,以及 SOA...

# 基于 PyTorch 的手写数字识别 # MNIST 数据集 MNIST 是一个经典的手写数字识别数据集,包含 60,000 张用于训练的图片和 10,000 张用于测试的图片。每张图片分辨率为 28×28 像素,内容是数字 0–9 的手写体。我们将基于该数据集对模型进行训练和验证。 # 神经网络的定义 # 输入 一张图片大小: 1 × 28 × 28 (灰度图,通道数 = 1) # 第一层卷积 nn.Conv2d(in_channels=1, out_channels=16, kernel_size=5, stride=1, padding=2) 输入: 1 × 28 ×...

# PyTorch 深度学习 基于小土堆:https://www.bilibili.com/video/BV1hE411t7RN # 安装 基于 conda 环境来安装 conda create --name pytorch python=3.11查询已有环境 conda info --envs conda environments: base * D:\anaconda pytorch D:\anaconda\envs\pytorch 激活 pytorch 环境 conda activate pytorch其他命令 conda remove -n...

# Pandas 核心处理方法 # 什么是 Pandas Pandas 是一个基于 Python 的开源数据分析和数据处理库 它提供了两种核心数据结构: 数据结构 描述 类似于 索引 数据存储 类比 Series 一维带标签的数组 一列 单索引 同质化 Excel 单列 DataFrame 二维带标签的表格数据结构 一张表格(像 Excel 表) 双索引 各个列之间可以是不同的 整个 Excel 表格 应用场景: 数据预处理(机器学习前) 数据统计分析 自动化报表 数据可视化前处理 # Series Series 就像这样: Series Index Series...