array2d
diff --git a/‎dl/layer/layer.go
Lines changed: 37 additions & 37 deletions b/‎dl/layer/layer.go
Lines changed: 37 additions & 37 deletions
diff --git a/‎dl/layer/linear.go
Lines changed: 10 additions & 10 deletions b/‎dl/layer/linear.go
Lines changed: 10 additions & 10 deletions
diff --git a/‎dl/tensor.go
Lines changed: 0 additions & 123 deletions b/‎dl/tensor.go
Lines changed: 0 additions & 123 deletions
diff --git a/‎dl/tensor_initializer.go
Lines changed: 1 addition & 1 deletion b/‎dl/tensor_initializer.go
Lines changed: 1 addition & 1 deletion
@@ -7,18 +7,18 @@ import (
 	"git.array2d.com/ai/deepgo/dl"
 )
 
-type f1_1 func(id int, input *dl.Tensor) *dl.Tensor
-type f2_1 func(id int, input1, input2 *dl.Tensor) *dl.Tensor
-type f1_2 func(id int, input *dl.Tensor) [2]*dl.Tensor
-type fN_1 func(id int, inputs []*dl.Tensor) *dl.Tensor
-type fN_N func(id int, inputs []*dl.Tensor) []*dl.Tensor
+type f1_1[T dl.Number] func(id int, input *dl.Tensor[T]) *dl.Tensor[T]
+type f2_1[T dl.Number] func(id int, input1, input2 *dl.Tensor[T]) *dl.Tensor[T]
+type f1_2[T dl.Number] func(id int, input *dl.Tensor[T]) [2]*dl.Tensor[T]
+type fN_1[T dl.Number] func(id int, inputs []*dl.Tensor[T]) *dl.Tensor[T]
+type fN_N[T dl.Number] func(id int, inputs []*dl.Tensor[T]) []*dl.Tensor[T]
 
-type RWTensor struct {
-	*dl.Tensor
+type RWTensor[T dl.Number] struct {
+	*dl.Tensor[T]
 	sync.RWMutex
 }
 
-type ComputeGraphNode struct {
+type ComputeGraphNode[T dl.Number] struct {
 	in, out  int
 	forward  map[[2]int]any
 	backward map[[2]int]any
@@ -27,16 +27,16 @@ type ComputeGraphNode struct {
 	//linear的input0~n
 	//activation的output0~n
 	//weight.grad,bias.grad
-	parameters map[string]*RWTensor
+	parameters map[string]*RWTensor[T]
 	attr       map[string]any
 }
 
 // NewNode 创建一个新的节点
-func NewNode(in, out int) *ComputeGraphNode {
-	node := &ComputeGraphNode{
+func NewNode[T dl.Number](in, out int) *ComputeGraphNode[T] {
+	node := &ComputeGraphNode[T]{
 		in:         in,
 		out:        out,
-		parameters: make(map[string]*RWTensor, runtime.NumCPU()*2+4),
+		parameters: make(map[string]*RWTensor[T], runtime.NumCPU()*2+4),
 		attr:       map[string]any{},
 		forward:    make(map[[2]int]any),
 		backward:   make(map[[2]int]any),
@@ -45,39 +45,39 @@ func NewNode(in, out int) *ComputeGraphNode {
 }
 
 // SetAttr 注册一个参数
-func (n *ComputeGraphNode) SetAttr(name string, attr any) {
+func (n *ComputeGraphNode[T]) SetAttr(name string, attr any) {
 	n.attr[name] = attr
 } // SetAttr 注册一个参数
-func (n *ComputeGraphNode) Attr(name string) (attr any) {
+func (n *ComputeGraphNode[T]) Attr(name string) (attr any) {
 	return n.attr[name]
 }
 
 // RegisterParameter 注册一个参数
-func (n *ComputeGraphNode) RegisterParameter(name string, param *dl.Tensor) {
+func (n *ComputeGraphNode[T]) RegisterParameter(name string, param *dl.Tensor[T]) {
 	if _, ok := n.parameters[name]; !ok {
-		n.parameters[name] = &RWTensor{}
+		n.parameters[name] = &RWTensor[T]{}
 	}
 	n.parameters[name].Tensor = param
 }
 
 // Parameters 返回所有注册的参数
-func (n *ComputeGraphNode) Parameter(name string) *RWTensor {
+func (n *ComputeGraphNode[T]) Parameter(name string) *RWTensor[T] {
 	return n.parameters[name]
 }
 
-func (n *ComputeGraphNode) Forward(id int, inputs ...*dl.Tensor) []*dl.Tensor {
+func (n *ComputeGraphNode[T]) Forward(id int, inputs ...*dl.Tensor[T]) []*dl.Tensor[T] {
 	if f, ok := n.forward[[2]int{n.in, n.out}]; ok {
 		switch f := f.(type) {
-		case f1_1:
-			return []*dl.Tensor{f(id, inputs[0])}
-		case f2_1:
-			return []*dl.Tensor{f(id, inputs[0], inputs[1])}
-		case f1_2:
+		case f1_1[T]:
+			return []*dl.Tensor[T]{f(id, inputs[0])}
+		case f2_1[T]:
+			return []*dl.Tensor[T]{f(id, inputs[0], inputs[1])}
+		case f1_2[T]:
 			r := f(id, inputs[0])
-			return []*dl.Tensor{r[0], r[1]}
-		case fN_1:
-			return []*dl.Tensor{f(id, inputs)}
-		case fN_N:
+			return []*dl.Tensor[T]{r[0], r[1]}
+		case fN_1[T]:
+			return []*dl.Tensor[T]{f(id, inputs)}
+		case fN_N[T]:
 			return f(id, inputs)
 		}
 	} else {
@@ -87,19 +87,19 @@ func (n *ComputeGraphNode) Forward(id int, inputs ...*dl.Tensor) []*dl.Tensor {
 }
 
 // Backward 执行反向传播
-func (n *ComputeGraphNode) Backward(id int, gradients ...*dl.Tensor) []*dl.Tensor {
+func (n *ComputeGraphNode[T]) Backward(id int, gradients ...*dl.Tensor[T]) []*dl.Tensor[T] {
 	if f, ok := n.backward[[2]int{n.in, n.out}]; ok {
 		switch f := f.(type) {
-		case f1_1:
-			return []*dl.Tensor{f(id, gradients[0])}
-		case f2_1:
-			return []*dl.Tensor{f(id, gradients[0], gradients[1])}
-		case f1_2:
+		case f1_1[T]:
+			return []*dl.Tensor[T]{f(id, gradients[0])}
+		case f2_1[T]:
+			return []*dl.Tensor[T]{f(id, gradients[0], gradients[1])}
+		case f1_2[T]:
 			r := f(id, gradients[0])
-			return []*dl.Tensor{r[0], r[1]}
-		case fN_1:
-			return []*dl.Tensor{f(id, gradients)}
-		case fN_N:
+			return []*dl.Tensor[T]{r[0], r[1]}
+		case fN_1[T]:
+			return []*dl.Tensor[T]{f(id, gradients)}
+		case fN_N[T]:
 			return f(id, gradients)
 		}
 	}
 
@@ -8,13 +8,13 @@ import (
 )
 
 // NewLinear 创建一个新的线性层，支持批处理
-func Linear(in_features, out_features int, biasInit bool) (l *ComputeGraphNode) {
-	l = NewNode(1, 1)
+func Linear[T dl.Number](in_features, out_features int, biasInit bool) (l *ComputeGraphNode[T]) {
+	l = NewNode[T](1, 1)
 
 	l.SetAttr("in_features", in_features)
 	l.SetAttr("out_features", out_features)
 	// 初始化权重和偏置,参考pytorch设计
-	weight_ := dl.NewTensor([]int{out_features, in_features})
+	weight_ := dl.NewTensor[T]([]int{out_features, in_features})
 
 	// 初始化权重
 	//何凯明大神，永远的神！用了这个，loss下降飞快100倍
@@ -23,15 +23,15 @@ func Linear(in_features, out_features int, biasInit bool) (l *ComputeGraphNode)
 
 	if biasInit {
 		// 初始化偏置
-		biasT := dl.NewTensor([]int{out_features})
-		fanIn, _ := dl.CalculateFanInAndFanOut(weight_)
+		biasT := dl.NewTensor[T]([]int{out_features})
+		fanIn, _ := weight_.CalculateFanInAndFanOut()
 		bound := 1 / math.Sqrt(float64(fanIn))
 		biasT.Uniform(-bound, bound)
 		l.RegisterParameter("bias", biasT)
 	} else {
-		l.RegisterParameter("bias", dl.NewTensor([]int{out_features}))
+		l.RegisterParameter("bias", dl.NewTensor[T]([]int{out_features}))
 	}
-	var f f1_1 = func(id int, input *dl.Tensor) (output *dl.Tensor) {
+	var f f1_1[T] = func(id int, input *dl.Tensor[T]) (output *dl.Tensor[T]) {
 		//由于backward需要input的梯度，所以这里需要保存input
 		l.RegisterParameter("input"+strconv.Itoa(id), input)
 		l.Parameter("weight").RLock()
@@ -43,9 +43,9 @@ func Linear(in_features, out_features int, biasInit bool) (l *ComputeGraphNode)
 		return
 	}
 	l.forward[[2]int{1, 1}] = f
-	l.RegisterParameter("weight.grad", dl.NewTensor([]int{out_features, in_features}))
-	l.RegisterParameter("bias.grad", dl.NewTensor([]int{out_features}))
-	var b f1_1 = func(id int, outputGrad *dl.Tensor) (inputGrad *dl.Tensor) {
+	l.RegisterParameter("weight.grad", dl.NewTensor[T]([]int{out_features, in_features}))
+	l.RegisterParameter("bias.grad", dl.NewTensor[T]([]int{out_features}))
+	var b f1_1[T] = func(id int, outputGrad *dl.Tensor[T]) (inputGrad *dl.Tensor[T]) {
 
 		// 在计算weight.Grad时，需要的是该层的input
 		// 获取当前层的输入，形状为 [batchSize, in_features]
 
@@ -3,7 +3,6 @@ package dl
 import (
 	"fmt"
 	"math"
-	"sort"
 )
 
 type Tensor[T Number] struct {
@@ -104,47 +103,6 @@ func (t *Tensor[T]) Range(dimCount int, f func(indices []int)) {
 		f(indices) // 调用传入的函数
 	}
 }
-func (t *Tensor[T]) SumDimMap(dims []int) (sumMap []int) {
-	// Step 1: 确定输出形状
-	sumDims := make([]int, len(dims))
-	copy(sumDims, dims)
-	sort.Ints(sumDims)
-	// 去重
-	sumDims = Unique(sumDims)
-
-	// 验证维度
-	for _, d := range sumDims {
-		if d < 0 || d >= len(t.Shape) {
-			panic("Dimension out of range in sum")
-		}
-	}
-
-	// 创建一个映射数组，标记哪些维度需要求和
-	sumMap = make([]int, len(t.Shape))
-	for _, dim := range sumDims {
-		sumMap[dim] = 1
-	}
-	return sumMap
-}
-func (t *Tensor[T]) SumShape(dims []int) []int {
-	// 创建一个映射数组，标记哪些维度需要求和
-	sumMap := t.SumDimMap(dims)
-
-	// 计算输出形状
-	outputShape := make([]int, 0)
-
-	for i := 0; i < len(t.Shape); i++ {
-		if sumMap[i] == 0 {
-			outputShape = append(outputShape, t.Shape[i])
-		}
-	}
-
-	// 如果所有维度都被求和，返回标量张量
-	if len(outputShape) == 0 {
-		outputShape = append(outputShape, 1)
-	}
-	return outputShape
-}
 
 // Print 打印Tensor的值
 func (t *Tensor[T]) Print(format_ ...string) {
@@ -222,84 +180,3 @@ func (t *Tensor[T]) Clone() *Tensor[T] {
 	copy(clone.Data, t.Data)
 	return clone
 }
-
-func (t *Tensor[T]) Transpose(dimOrder []int) *Tensor[T] {
-	if len(dimOrder) != len(t.Shape) {
-		panic("dimOrder length must be equal to the number of dimensions in the tensor")
-	}
-	newShape := make([]int, len(t.Shape))
-	for i, dim := range dimOrder {
-		newShape[i] = t.Shape[dim]
-	}
-	result := NewTensor[T](newShape)
-	if t.Len() != result.Len() {
-		panic("transpose error: newShape:" + fmt.Sprint(newShape) + " oldShape:" + fmt.Sprint(t.Shape))
-	}
-	t.Range(len(dimOrder), func(indices []int) {
-		newIndices := make([]int, len(indices))
-		for i, dim := range dimOrder {
-			newIndices[i] = indices[dim]
-		}
-		result.Set(newIndices, t.Get(indices...))
-	})
-	return result
-}
-func (t *Tensor[T]) Sum(dims []int) *Tensor[T] {
-	// 创建一个映射数组，标记哪些维度需要求和
-	sumMap := t.SumDimMap(dims)
-	// 计算输出形状
-	outputShape := t.SumShape(dims)
-
-	result := NewTensor[T](outputShape)
-
-	// Step 2: 使用 range 遍历输入张量
-	t.Range(len(t.Shape), func(indices []int) {
-		// 计算输出索引
-		outputIndices := make([]int, len(result.Shape))
-		for i, j := 0, 0; i < len(t.Shape); i++ {
-			if sumMap[i] == 0 {
-				outputIndices[j] = indices[i]
-				j++
-			}
-		}
-
-		// 累加求和
-		inputIdx := t.LinearAt(indices)
-		outputIdx := result.LinearAt(outputIndices)
-		result.Data[outputIdx] += t.Data[inputIdx]
-	})
-	return result
-}
-func (a *Tensor[T]) MatMulShape(b *Tensor[T]) (c []int) {
-	if len(a.Shape) < 2 || len(b.Shape) < 2 {
-		panic("TensorCPU dimensions do not match for multiplication")
-	}
-	if a.Shape[len(a.Shape)-1] != b.Shape[len(b.Shape)-2] {
-		panic("TensorCPU dimensions do not match for multiplication")
-	}
-	resultShape := make([]int, len(a.Shape))
-	copy(resultShape, a.Shape)
-	resultShape[len(resultShape)-1] = b.Shape[len(b.Shape)-1]
-	return resultShape
-}
-
-// MatMul 实现高维矩阵 Tensor 的矩阵乘法
-// 矩阵的最后两维满足:A矩阵的列数B矩阵的行数相等
-func (a *Tensor[T]) MatMul(b *Tensor[T]) (c *Tensor[T]) {
-	c = NewTensor[T](a.MatMulShape(b))
-	c.Range(len(c.Shape)-2, func(indices []int) {
-		aIdx := a.LinearAt(indices)
-		bIdx := b.LinearAt(indices)
-		cIdx := c.LinearAt(indices)
-
-		m, k, n := c.Shape[len(c.Shape)-2], a.Shape[len(a.Shape)-1], c.Shape[len(c.Shape)-1]
-		for i := 0; i < m; i++ {
-			for j := 0; j < n; j++ {
-				for x := 0; x < k; x++ {
-					c.Data[cIdx+i*n+j] += a.Data[aIdx+i*k+x] * b.Data[bIdx+x*n+j]
-				}
-			}
-		}
-	})
-	return c
-}
@@ -59,7 +59,7 @@ func (t *Tensor[T]) Uniform(low, high float64) {
 // Linear 从 low 到 high 线性初始化张量
 func (t *Tensor[T]) Linear(low, high float64) {
 	n := len(t.Data)
-	step := (high - low) / float64(n)
+	step := (high - low) / float64(n-1)
 	for i := 0; i < n; i++ {
 		t.Data[i] = T(low + float64(i)*step)
 	}
Original file line number	Diff line number	Diff line change
`@@ -59,7 +59,7 @@ func (t *Tensor[T]) Uniform(low, high float64) {`
`59`	`59`	`// Linear 从 low 到 high 线性初始化张量`
`60`	`60`	`func (t *Tensor[T]) Linear(low, high float64) {`
`61`	`61`	`n := len(t.Data)`
`62`		`- step := (high - low) / float64(n)`
	`62`	`+ step := (high - low) / float64(n-1)`
`63`	`63`	`for i := 0; i < n; i++ {`
`64`	`64`	`t.Data[i] = T(low + float64(i)*step)`
`65`	`65`	`}`